AI

DeepSeekが数学的推論に特化したAIモデル「DeepSeek-Math-V2」をリリース、国際数学オリンピックで金メダルを取れるレベルの正答率を記録


DeepSeekが、数学的推論に特化したAIモデル「DeepSeek-Math-V2」を2025年11月27日に公開しました。このDeepSeek-Math-V2は定理証明と自己検証機能に重点を置いており、従来の数学AIモデルとは異なり、解答の正確性を追求するだけでなく、推論プロセスの厳密性と完全性も重視しています。

GitHub - deepseek-ai/DeepSeek-Math-V2
https://github.com/deepseek-ai/DeepSeek-Math-V2

deepseek-ai/DeepSeek-Math-V2 · Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-Math-V2

2025 Major Release: How Does DeepSeekMath-V2 Achieve Self-Verifying Mathematical Reasoning? Complete Technical Analysis - CurateClick
https://curateclick.com/blog/deepseekmath-v2

従来の大規模言語モデルは主に最終的な答えが合っているかどうかを報酬として与える「強化学習」によってトレーニングされてきました。しかし、この方法では、答えが偶然合っていても途中の考え方が間違っている場合を見抜くことができません。特に、定理の証明のような高度な数学においては、数値の答えが存在せず、厳密な論理の積み重ねそのものが求められるため、従来の手法だけでは限界がありました。


この課題を解決するために採用された技術が、証明を作成する「生成器」と、その証明が正しいかを判定する「検証器」という2つのモデルを協力させるアーキテクチャです。

DeepSeek-Math-V2のトレーニングは3つの段階で行われます。最初に検証器をトレーニングし、次にその検証器を先生役として生成器を学習させます。次に、生成器は検証器からのフィードバックを受け取りながら、自分の証明に含まれる誤りを特定し、修正するように訓練されます。そして、検証のための計算量を増やすことで、AIが自動的に難しい証明の正誤を判断し、それを新たな学習データとして活用することで、検証器の能力をさらに高めるというサイクルを回します。


この技術的な革新により、DeepSeek-Math-V2は世界的な数学コンテストで非常に高い成績を収めています。たとえば、2025年の国際数学オリンピック(IMO)では金メダルレベルとなる83.3%の得点率を記録しました。また、カナダ数学オリンピック(CMO)2024では73.8%、アメリカの大学レベルの競技であるPutnam 2024においては98.3%という驚異的なスコアを達成しています。


他社の高性能モデルと比較しても、Gemini Deep ThinkやClaude Sonnet 4などを上回る成果をProofBenchという評価指標で示しており、特に難易度の高い問題においてその強さを発揮しています。


DeepSeek-Math-V2はDeepSeek-V3.2-Exp-Baseをベースに構築されており、Hugging Faceからダウンロードすることが可能です。

この記事のタイトルとURLをコピーする

・関連記事
DeepSeekが視覚情報を使用してテキスト入力を圧縮するマルチモーダルAIモデル「DeepSeek-OCR」をリリース - GIGAZINE

中国AI企業「DeepSeek」が長大な入力でも低コストを維持できるAIモデル「DeepSeek-V3.2-Exp」を公開 - GIGAZINE

DeepSeekが推論モデル「R1」をわずか4400万円でトレーニングしたと発表、512基のNVIDIA H800チップを80時間使用 - GIGAZINE

「DeepSeek-V3.1」登場、推論モードと非推論モードを両立させてDeepSeek-R1より高速化したハイブリッドモデル - GIGAZINE

中国政府がDeepSeekの新AIモデル「DeepSeek-R2」をHuawei製チップで開発するよう求めたが失敗してリリースが遅れているとの報道 - GIGAZINE

Googleの強化版Geminiが数学オリンピックで金メダルを取る性能に到達、自然言語で動作し人間と同じ制限時間で解答を導き出す - GIGAZINE

OpenAIの「実験的推論モデル」が数学オリンピックで金メダル相当のスコアを達成、GPT-5は近日中にリリース予定で「実験的推論モデル」はまだ先 - GIGAZINE

OpenAIとGoogleのAIがプログラミング大会「ICPC 2025」に参加し金メダル相当の記録を達成、OpenAIは全問正解でGoogleは2問ミス - GIGAZINE

in AI, Posted by log1i_yk

You can read the machine translated English article DeepSeek releases AI model 'DeepSeek-Mat….