Gemini 3 Deep Thinkのアップグレード版が登場、知性を測定するARC-AGIで驚異的な記録を更新

GoogleがGemini 3の推論能力強化版である「Gemini 3 Deep Think」のアップデートを実施したことを2026年2月12日に発表しました。アップデートは研究者と緊密に連携して困難な研究課題に取り組むことに焦点を当てたもので、各種ベンチマークで驚異的なスコアを記録しています。
Gemini 3 Deep Think: AI model update designed for science
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/
Gemini 3 Deep ThinkはAIの知能を測定するベンチマーク「ARC-AGI-2」で高いスコアを記録しました。以下は左が2025年12月の発表時におけるGemini 3 Deep ThinkのARC-AGI-2スコアで、この時点で45%と他の主要モデルと比較してかなり高くなっていました。そして、アップグレード版では以下の画像右のグラフにあるように、ARC-AGI-2スコアが84.6%と驚異的な数値まで上昇しています。

以下はARCがXに投稿したARC-AGI-2のリーダーボードで、右上に緑色で表示されているGemini 3 Deep Thinkのスコアが飛び抜けていることがよく分かります。
Gemini 3 Deep Think (2/26) Semi Private Eval
— ARC Prize (@arcprize) 2026年2月12日
- ARC-AGI-1: 96.0%, $7.17/task
- ARC-AGI-2: 84.6% $13.62/task
New ARC-AGI SOTA model from @GoogleDeepMind pic.twitter.com/mN8PFAWk4A
そのほか、AIの知識の限界をテストするために設計されたベンチマーク「Humanity's Last Exam」では48.4%、マルチモーダルLLM向けテスト「MMMU-Pro」では81.5%と、いずれも高い水準を記録しています。さらに、競技プログラムベンチマークの「Codefoces」では、3455と驚異的な数値を達成しました。

Gemini 3 Deep Thinkは、数学や競技コーディングに加え、化学や物理学といった幅広い科学分野で優れた性能を発揮します。Googleによると、アップデートされたDeep Thinkモードは2025年国際物理オリンピックおよび化学オリンピックの筆記試験で金メダルレベルの成績を収めているとのこと。また、高度な理論物理学の指標である「CMTベンチマーク」で50.5%のスコアを達成し、高度な理論物理学における熟達具合も示されています。

GoogleはGemini 3 Deep Thinkが実際の科学研究に役立っていることをアピールしています。以下はデューク大学で新しい半導体材料を研究するラボにおいてGemini 3 Deep Thinkが活用されている様子。半導体の材料の潜在的発見を目指して、複雑な結晶成長のための製造方法を最適化するためにGemini 3 Deep Thinkが利用されており、従来の方法では達成が困難だった正確な目標値を達成することができたとのこと。
We’ve upgraded our specialized reasoning mode Gemini 3 Deep Think to help solve modern science, research, and engineering challenges – pushing the frontier of intelligence. 🧠
— Google DeepMind (@GoogleDeepMind) 2026年2月12日
Watch how the Wang Lab at Duke University is using it to design new semiconductor materials. 🧵 pic.twitter.com/BgSEmv00JP
また、ラトガース大学の数学者であるリサ・カーボン氏は、既存の学習データがほとんどない分野の研究において、Gemini 3 Deep Thinkを用いて高度に技術的な数学論文の査読を行いました。これにより、人間の査読では見過ごされていた論理的欠陥を的確に特定することができたと報告しています。
At Rutgers, mathematician Lisa Carbone is using Gemini 3 Deep Think to explore the math bridging Einstein’s gravity and quantum mechanics — a pioneering field of research with very little historical data or relevant papers to reference.
— Google (@Google) 2026年2月12日
Despite having limited existing data to… pic.twitter.com/Ku4n8Et4hK
アップデートされたGemini 3 Deep Thinkは、記事作成時点ではGoogle AI Ultraの加入者向けに展開されています。また、一部の研究者、エンジニア、企業に対してGemini API経由でGemini 3 Deep Thinkを利用できる早期アクセスプログラムが提供されています。
・関連記事
Googleが「Gemini 3 Deep Think」をリリース、Gemini 3 ProやGPT-5 Proを大きく上回る性能 - GIGAZINE
「人間には簡単だがAIには難しい」とされるゲーム課題を実際に無料でプレイできる「ARC Prize - Play the Game」 - GIGAZINE
Googleが「Geminiの能力を抽出して競合AIを開発しようとする蒸留攻撃が増加している」と報告 - GIGAZINE
GoogleがGemini 3 Deep Thinkをベースとしたエージェント「Aletheia」で数学の自律的な研究に成功したとアピール - GIGAZINE
Gemini 3.0 ProやGPT-5.2に匹敵する中国製AI「GLM-5」が登場、Word文書作成などの事務作業も可能でモデルを自由にダウンロード可能 - GIGAZINE
・関連コンテンツ
in AI, Posted by log1e_dh
You can read the machine translated English article Gemini 3 Deep Think Upgrade Released, Br….







