「DeepSeek-V3.1」登場、推論モードと非推論モードを両立させてDeepSeek-R1より高速化したハイブリッドモデル

by Trong Khiem Nguyen
中国のAI企業であるDeepSeekがオープンウェイトモデル「DeepSeek-V3.1」を2025年8月21日にリリースしました。このモデルは、エージェントの時代に向けた第一歩として位置づけられており、推論モードと非推論モードを両立させて高速化を図るハイブリッドモデルとなっています。
DeepSeek-V3.1 Release | DeepSeek API Docs
https://api-docs.deepseek.com/news/news250821
Introducing DeepSeek-V3.1: our first step toward the agent era! ????
— DeepSeek (@deepseek_ai) August 21, 2025
???? Hybrid inference: Think & Non-Think — one model, two modes
⚡️ Faster thinking: DeepSeek-V3.1-Think reaches answers in less time vs. DeepSeek-R1-0528
????️ Stronger agent skills: Post-training boosts tool use and…
DeepSeek-V3.1の主な特徴は、思考を行う「Think」モードと、行わない「Non-Think」モードの2つを1つのモデル内に持つハイブリッド推論スタイルです。Thinkモードは思考速度が向上しており、旧モデルのDeepSeek-R1-0528よりも短時間で回答を生成します。また、事前トレーニングにより、ツールの使用や複数ステップを要するエージェントタスクのスキルが強化されているとのこと。この新機能は、公式サイトのチャットで「DeepThink」ボタンを切り替えることで試用できます。
DeepSeek - Into the Unknown
https://chat.deepseek.com/
APIも更新され、「deepseek-reasoner」がThinkモード、「deepseek-chat」がNon-Thinkモードとして提供されます。両モデルともに128Kのコンテキスト長をサポートしており、さらにAnthropic APIフォーマットや、ベータAPIでの厳密な関数呼び出し(Strict Function Calling)にも対応しました。APIリソースも増強され、よりスムーズな利用体験が提供されます。
ツールとエージェントの機能もアップグレードされ、SWE-benchやTerminal-Benchといったベンチマークでより良い結果を記録しています。複雑な検索タスクにおける複数ステップの推論能力が強化され、思考の効率も大幅に向上しました。
ベンチマークスコアを見ると、SWE-bench Verifiedで66.0を記録し、DeepSeek-V3-0324の45.4やDeepSeek-R1-0528の44.6を上回りました。SWE-bench Multilingualでは54.5、Terminal-Benchでは31.3を達成しています。

その他のベンチマークにおいても、BrowseCompで30.0、BrowseComp_zhで49.2、Humanity's Last Examで29.8、xbench-DeepSearchで71.2など、多くの項目でDeepSeek-R1-0528のスコアを上回る結果を示しました。

思考効率の向上は出力トークン数にも反映されており、DeepSeek-V3.1のThinkモードはDeepSeek-R1-0528と比較して、AIME 2025では22,615から15,889へ、GPQA Diamondでは7,678から4,122へ、LiveCodeBenchでは19,352から13,977へと、それぞれ出力トークン数を削減しています。

DeepSeek-V3.1のモデルデータおよびトークナイザー、チャットテンプレートはHugging Faceで公開されています。また、モデルの基盤となるDeepSeek-V3.1-Baseも同時に公開されています。このDeepSeek-V3.1-BaseはV3をベースに長文コンテキスト拡張のため8400億トークンの継続的な事前学習を行ったものだそうです。
deepseek-ai/DeepSeek-V3.1-Base · Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
deepseek-ai/DeepSeek-V3.1 · Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
DeepSeek-V3.1 APIの料金は、入力が100万トークンあたり0.07ドル(約11円)~0.56ドル(約80円)、出力が100万トークンあたり1.68ドル(約250円)に設定されています。
・関連記事
中国政府がDeepSeekの新AIモデル「DeepSeek-R2」をHuawei製チップで開発するよう求めたが失敗してリリースが遅れているとの報道 - GIGAZINE
DeepSeekよりも安価に高性能のAIを使用できるオープンソースモデル「GLM-4.5」を中国のAI企業がリリース - GIGAZINE
AI企業「DeepSeek」がオープンソースの範囲を超えてユーザーデータを中国政府に提供し軍事・諜報活動を支援しているとアメリカ政府高官が発表 - GIGAZINE
ChatGPTとGeminiとDeepSeekとClaudeで5つのテストをして最も優秀だったのはどのモデルなのか? - GIGAZINE
中国製高性能AIモデル「DeepSeek-R1-0528」はGoogleのAI「Gemini」を使用して蒸留した可能性ありとの臆測が飛び交う - GIGAZINE
DeepSeekが数学的推論に特化した「DeepSeek-Prover-V2」をひっそりとリリース、複雑な定理の形式証明に対応 - GIGAZINE
・関連コンテンツ
in AI, ソフトウェア, Posted by log1i_yk
You can read the machine translated English article Introducing 'DeepSeek-V3.1,' a hybrid mo….







