ソフトウェア

Googleの強化版Geminiが数学オリンピックで金メダルを取る性能に到達、自然言語で動作し人間と同じ制限時間で解答を導き出す


Googleが「Gemini Deep Think」の強化版で国際数学オリンピックに挑戦し、金メダル相当のスコアを達成したことを日本時間の2025年7月22日に発表しました。当該AIはテスターによるテスト期間を経てGoogle AI Ultraの加入者向けに提供される予定です。

Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad - Google DeepMind
https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/

国際数学オリンピックでは参加者に6問の難問が課され、上位8%の参加者に金メダルが授与されます。強化版Gemini Deep Thinkは6問中5問を完璧に解くことに成功し、合計35ポイントを獲得して金メダル相当の記録を達成しました。国際数学オリンピックの問題とGeminiの解答は以下のリンク先で公開されています。

Gemini Deep Think for International Mathematical Olympiad 2025
(PDFファイル)https://storage.googleapis.com/deepmind-media/gemini/IMO_2025.pdf


Googleはこれまでも自社製AIを用いて国際数学オリンピックに挑戦しており、2024年には「AlphaProof」と「AlphaGeometry 2」を組み合わせて銀メダル相当のスコアを得ることに成功していました。しかし、2024年の挑戦では「自然言語をAIにとって処理しやすいドメイン固有言語に変換する処理」が必要だったほか、計算にも2~3日もの時間を要しました。今回の強化版Gemini Deep Thinkを用いた挑戦では、自然言語のまま入力し、人間の参加者と同じ4時間30分という制限時間で金メダル相当のスコアを得ることに成功しています。

数学オリンピックの問題で銀メダルレベルのスコアを残すAIを開発したとGoogle DeepMindが発表 - GIGAZINE


強化版Gemini Deep Thinkは数学者を含む信頼できるテスターによるテスト期間を経て、Google AI Ultraの加入者向けに公開される予定です。


なお、OpenAIも2025年7月19日に同様の成果を発表していますが、Google DeepMindのデミス・ハサビスCEOは「これは余談ですが、私たちは金曜日には発表しませんでした。なぜなら、国際数学オリンピック委員会からの『すべてのAI研究機関の結果が独立した専門家によって検証され、人間の参加者たちが当然うけるべき称賛を得るまでは結果を共有しないでほしい』という要望に従ったからです」とコメントし、委員会の要望に従わず早期に結果を公開したAI研究機関に苦言を呈しています。


ちなみに、国際数学オリンピックの日本代表選手は金メダル3、銀メダル2、銅メダル1という結果で、狩野慧志さんが満点を獲得し世界1位に輝いています。

この記事のタイトルとURLをコピーする

・関連記事
Gemini 2.5 Proに実験的な強化推論モード「Deep Think」が追加される - GIGAZINE

Google Geminiが40年以上前のゲーム機とのチェス対決を放棄して不戦敗、ChatGPTの敗北を知ったため - GIGAZINE

DeepSeekが数学的推論に特化した「DeepSeek-Prover-V2」をひっそりとリリース、複雑な定理の形式証明に対応 - GIGAZINE

OpenAIのo3モデルが数学の超難問データセット「FrontierMath」で25.2%のスコアを獲得した衝撃を数学者が語る - GIGAZINE

GPT-4.1超えの中国製AIモデル「Kimi K2」が無料公開される、複数のテストでGPT-4.1やClaude 4 Opusを打ち負かしエージェントタスクもこなす - GIGAZINE

ついに「Grok 4」が登場、OpenAIなどの推論モデルを超える性能で「世界最強AIモデル」とアピールするも「イーロン・マスクの発言を参考にしまくる」という挙動も確認される - GIGAZINE

多言語・長文コンテキスト推論AI「SmolLM3」をHugging Faceがリリース、パラメータの少ない小規模言語モデルでありながらより大規模な言語モデルの性能に匹敵 - GIGAZINE

in AI,   ソフトウェア, Posted by log1o_hf

You can read the machine translated English article Google's enhanced Gemini reaches gol….