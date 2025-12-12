2025年12月12日 12時07分 AI

Googleが「Gemini Deep Research エージェント」をリリース＆ベンチマーク「DeepSearchQA」オープンソース化



Googleが、「Gemini Deep Research」のウェブ検索能力を大幅に強化した「Gemini Deep Research エージェント」を、Interaction API経由で利用可能にすることを発表しました。また、ディープサーチエージェント評価用のベンチマーク「DeepSearchQA」のオープンソース化も行われています。



Build with Gemini Deep Research

https://blog.google/technology/developers/deep-research-agent-gemini-api/





Gemini Deep Research エージェント | Gemini API | Google AI for Developers

https://ai.google.dev/gemini-api/docs/deep-research



「Gemini Deep Research」は、長期にわたる文脈収集・統合タスク向けに最適化されたAI検索機能として2024年12月に登場。2025年1月からは日本語にも対応しています。



人力で数時間かかる情報収集作業を数分で実行できるGoogle製AI検索機能「Deep Research」が日本語でも利用可能に - GIGAZINE





Google DeepMindのプロダクトマネージャー、ルーカス・ハース氏によると、まったく新しい「Gemini Deep Research エージェント」は、推論コアとしてGoogle最高峰のファクチュアルモデル(事実に即した正確な情報を提供するモデル)であるGemini 3 Proを採用し、複雑なタスクでの「幻覚」低減とレポート品質をできる限り高めることに特化してトレーニングが行われているとのこと。また、検索のための多段階強化学習を拡張することにより、複雑な情報環境でも高精度で自律的に探索を行います。



Gemini Deep Research エージェントは、最難関AIテストである「Humanity's Last Exam(HLE)」と、ウェブ検索タスクのベンチマークとなる「DeepSearchQA」で最先端の結果を達成しているほか、OpenAIの高難度ベンチマーク「BrowseComp」でもGoogleとして最高の性能を実現しているとのこと。



以下は、Gemini Deep Research・Gemini 3 Pro・o4-mini deep research・o3-deep research・GPT-5 Proの5つのモデルで、3つのベンチマークテストを行った際のスコアを示したもの。青色で示されたGemini Deep Researchが、水色で示されたGemini 3 Proを上回り、斜線かけで示されたGPT-5 Proと匹敵するか上回るスコアを出しているのがわかります。





Gemini Deep Research エージェントは、Interactions API経由でリリースされ、開発者は自社アプリにGemini Deep Research エージェントを直接組み込めるようになっています。また、まもなくGoogle検索やNotebookLM、Google Financeで利用可能になり、Geminiアプリにも搭載されるとのことです。



このほか、ベンチマークで利用された「DeepSearchQA」のオープンソース化も決まりました。DeepSearchQAは、エージェントの複雑な多段階情報探索タスク能力を評価するためのベンチマークで、17分野にわたる900の「因果連鎖」タスクを実装していて、各ステップは先行分析に依存しています。これまでのベンチマークは実証ベースでしたが、DeepSearchQAはエージェントに網羅的回答セットを生成させることで包括性を測定、調査精度と検索再現性の両方を評価します。また「思考時間」の効果診断にも機能します。



Google DeepMindは、より優れたエージェントの開発に向けた研究の促進のため、データセットやリーダーボード、技術報告書などのリソースを公開しています。

