GoogleがGemini 3 Deep Thinkをベースとしたエージェント「Aletheia」で数学の自律的な研究に成功したとアピール

Google DeepMindが、Geminiの高度な推論機能「Deep Think」を活用した数学研究エージェント「Aletheia」を開発し、専門的な数学研究において自律的な成果を上げたと発表しました。このエージェントは自然言語を用いて解答の生成、検証、修正をエンドツーエンドで繰り返す能力を持ち、国際数学オリンピック(IMO)レベルの難問から博士課程レベルの演習、さらには実際の学術研究における未解決問題の解決まで、多岐にわたるマイルストーンを達成しています。
Gemini Deep Think: Redefining the Future of Scientific Research — Google DeepMind
https://deepmind.google/blog/accelerating-mathematical-and-scientific-discovery-with-gemini-deep-think/
superhuman/aletheia/Aletheia.pdf at main · google-deepmind/superhuman · GitHub
https://github.com/google-deepmind/superhuman/blob/main/aletheia/Aletheia.pdf
Aletheiaは、非常に困難な推論課題を解決するために開発されたGemini 3 Deep Thinkを基盤としています。このシステムは解答を生成する「Generator」、その正誤を判定する「Verifier」、そして微修正を行う「Reviser」という3つのサブエージェントが相互に作用して動作します。

従来の大型言語モデルは専門的なトピックにおいて幻覚(ハルシネーション)を起こしやすく、不正確な情報を出力する課題がありましたが、AletheiaはGoogle検索などのツールを駆使して文献をナビゲートすることで、根拠のない引用や計算ミスを大幅に削減しています。また、推論時間に割り当てる計算量を増やすことで精度が向上するという「スケーリング則」が、競技数学のみならず博士レベルの数学演習においても有効であることが示されました。
ベンチマーク評価では、AletheiaはIMO-Proof Bench Advancedで95.1%という最高精度を記録し、博士レベルの演習を集めたFutureMath Basicでも優れた性能を示したとGoogle DeepMindはアピールしています。

Aletheiaは、人間による介入なしに算術幾何学の構造定数である「eigenweights」を計算し、その結果をもとにした研究論文を完全に自律して生成するという画期的な成果を上げたとのこと。この過程で、エージェントは代数的組合せ論の手法を用いるなど、独創的な解決策を提示したとGoogle DeepMindは報告しています。
また、独立集合の境界を証明する研究では、Aletheiaが「大きな絵」となる戦略を提案し、人間がそれを詳細に記述するという逆転した形式の共同研究が行われました。さらに、エルデシュ予想データベースにある700の未解決問題に対する大規模な評価では、4つの未解決問題を自律的に解決し、そのうちの一つはさらなる一般化を経て独立した論文へと繋がったとのこと。
さらにGoogle DeepMindは、AIが生成した数学的成果を適切に評価するために、自動車の自動運転レベルになぞらえた「数学研究自律レベル」という分類法を提唱しています。 この枠組みでは、AIの寄与度を「主に人間(Human with secondary AI input)」「人間とAIの共同(Human-AI Collaboration)」「本質的に自律(Essentially Autonomous)」の3段階に、数学的な重要性をレベル0の「無視できる新規性(Negligible Novelty)」からレベル4の「画期的な突破口(Landmark Breakthrough)」までの5段階に区分しており、透明性の高い情報共有を目指しています。Google DeepMindは先述の研究成果を最高でレベル2の「公表可能な研究(Publishable Research)」に分類しており、すでに査読に提出しています。

Google DeepMindによれば、Gemini Deep Thinkの応用範囲は数学に留まらず、物理学や計算機科学の難問解決にも及んでいるとのこと。これらの結果はAIが膨大な知識を統合して異なる学問分野の橋渡しをすることで、人間の科学者にとって強力な伴走者になり得ることを示唆しているとGoogle DeepMindは述べました。
なお、Aletheiaで各論文を生成するために入力されたプロンプトと出力はGitHubで公開されています。
superhuman/aletheia at main · google-deepmind/superhuman · GitHub
https://github.com/google-deepmind/superhuman/tree/main/aletheia
・関連記事
AIで数学の未解決問題をほぼ自動的に解くことに成功、AIツールにおける重要な進展に - GIGAZINE
AIが及ぼす経済的影響レポートをClaude開発企業のAnthropicが公開、国やタスクによってAIの効果には大きなバラつきがある - GIGAZINE
AIが計算問題を間違えただけでなくエラーを隠すために検証結果をでっち上げたという報告 - GIGAZINE
Googleが2025年の研究開発を総括、AI・医療・科学・コンピューティング・クリエイティブなどあらゆる分野で発揮されたGoogleの英知の数々 - GIGAZINE
・関連コンテンツ
in AI, サイエンス, Posted by log1i_yk
You can read the machine translated English article Google claims that its Gemini 3 Deep Thi….







