2026年02月13日 13時00分 AI

Gemini 3 Deep Thinkのアップグレード版が登場、知性を測定するARC-AGIで驚異的な記録を更新

GoogleがGemini 3の推論能力強化版である「Gemini 3 Deep Think」のアップデートを実施したことを2026年2月12日に発表しました。アップデートは研究者と緊密に連携して困難な研究課題に取り組むことに焦点を当てたもので、各種ベンチマークで驚異的なスコアを記録しています。

Gemini 3 Deep Think: AI model update designed for science
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

Gemini 3 Deep ThinkはAIの知能を測定するベンチマーク「ARC-AGI-2」で高いスコアを記録しました。以下は左が2025年12月の発表時におけるGemini 3 Deep ThinkのARC-AGI-2スコアで、この時点で45％と他の主要モデルと比較してかなり高くなっていました。そして、アップグレード版では以下の画像右のグラフにあるように、ARC-AGI-2スコアが84.6％と驚異的な数値まで上昇しています。

以下はARCがXに投稿したARC-AGI-2のリーダーボードで、右上に緑色で表示されているGemini 3 Deep Thinkのスコアが飛び抜けていることがよく分かります。

Gemini 3 Deep Think (2/26) Semi Private Eval

- ARC-AGI-1: 96.0%, $7.17/task
- ARC-AGI-2: 84.6% $13.62/task

New ARC-AGI SOTA model from @GoogleDeepMind pic.twitter.com/mN8PFAWk4A
— ARC Prize (@arcprize) 2026年2月12日

そのほか、AIの知識の限界をテストするために設計されたベンチマーク「Humanity's Last Exam」では48.4％、マルチモーダルLLM向けテスト「MMMU-Pro」では81.5％と、いずれも高い水準を記録しています。さらに、競技プログラムベンチマークの「Codefoces」では、3455と驚異的な数値を達成しました。

Gemini 3 Deep Thinkは、数学や競技コーディングに加え、化学や物理学といった幅広い科学分野で優れた性能を発揮します。Googleによると、アップデートされたDeep Thinkモードは2025年国際物理オリンピックおよび化学オリンピックの筆記試験で金メダルレベルの成績を収めているとのこと。また、高度な理論物理学の指標である「CMTベンチマーク」で50.5％のスコアを達成し、高度な理論物理学における熟達具合も示されています。

GoogleはGemini 3 Deep Thinkが実際の科学研究に役立っていることをアピールしています。以下はデューク大学で新しい半導体材料を研究するラボにおいてGemini 3 Deep Thinkが活用されている様子。半導体の材料の潜在的発見を目指して、複雑な結晶成長のための製造方法を最適化するためにGemini 3 Deep Thinkが利用されており、従来の方法では達成が困難だった正確な目標値を達成することができたとのこと。

We’ve upgraded our specialized reasoning mode Gemini 3 Deep Think to help solve modern science, research, and engineering challenges – pushing the frontier of intelligence. 🧠

Watch how the Wang Lab at Duke University is using it to design new semiconductor materials. 🧵 pic.twitter.com/BgSEmv00JP
— Google DeepMind (@GoogleDeepMind) 2026年2月12日

また、ラトガース大学の数学者であるリサ・カーボン氏は、既存の学習データがほとんどない分野の研究において、Gemini 3 Deep Thinkを用いて高度に技術的な数学論文の査読を行いました。これにより、人間の査読では見過ごされていた論理的欠陥を的確に特定することができたと報告しています。

At Rutgers, mathematician Lisa Carbone is using Gemini 3 Deep Think to explore the math bridging Einstein’s gravity and quantum mechanics — a pioneering field of research with very little historical data or relevant papers to reference.

Despite having limited existing data to… pic.twitter.com/Ku4n8Et4hK
— Google (@Google) 2026年2月12日

アップデートされたGemini 3 Deep Thinkは、記事作成時点ではGoogle AI Ultraの加入者向けに展開されています。また、一部の研究者、エンジニア、企業に対してGemini API経由でGemini 3 Deep Thinkを利用できる早期アクセスプログラムが提供されています。