ソフトウェア

OpenAIのAIエージェント「Deep research」のオープン版をHugging Faceが開発中


OpenAIが発表した、インターネット上の情報を検索して推論を行うAIエージェント「Deep research」のオープン版を、AI開発プラットフォームHugging Faceの開発者らが構築していることがわかりました。

Open-source DeepResearch – Freeing our search agents
https://huggingface.co/blog/open-deep-research


Hugging Face researchers aim to build an 'open' version of OpenAI's deep research tool | TechCrunch
https://techcrunch.com/2025/02/04/hugging-face-researchers-aim-to-build-an-open-version-of-openais-deep-research-tool/

Deep researchはインターネット上の情報を検索可能なAIエージェントで、「コンテンツの発見」「コンテンツの統合」「情報についての推論」という3つの主要な機能を備えています。Deep researchはChatGPTに統合されて一般に利用できるようになる予定で、既にサブスクリプションサービスのChatGPT Proで使えるようになっています。


ChatGPTはインターネット上の情報を検索することができず、あらかじめ与えられた情報のみを使ってユーザーのリクエストに応えることしかできませんでしたが、Deep researchが統合されることで、より柔軟にユーザーのリクエストを処理できるようになることが期待されています。

OpenAIがChatGPTにオンライン上の情報を収集させる「Deep research」機能を搭載すると発表 - GIGAZINE


ところが、Deep researchは記事作成時点で有料会員しか利用できず、今後のロードマップでも各種有料会員向けに順次展開されることしかわかっていません。

こうした状況の中、Hugging Faceの共同設立者兼チーフ・サイエンティストであるトーマス・ウルフ氏ら開発者グループが、Deep researchの「オープン」版である「Open Deep Research」を構築していることがわかりました。

ウルフ氏らによると、大本のDeep researchは「大規模言語モデル(OpenAI 4o、o1、o3など)」と「エージェントフレームワーク」で構成されているとのこと。エージェントフレームワークはAIシステムに組み込まれたツールで、LLMがウェブサイトを閲覧したり、PDFファイルを読んだりするために使われます。

OpenAIがDeep researchの基礎となるエージェントフレームワークについてあまり公表していないことに目を付けたウルフ氏らは、このエージェントフレームワークをオープンソースで独自に作成することにしました。

Open Deep Researchは、OpenAIの「o1」とオープンソースのエージェントフレームワークで構成されています。o1はプロプライエタリなモデル、つまり有料のAPIで保護されているものですが、エージェントフレームワークの方はオープンなのが特徴です。エージェントフレームワークをオープンソースで開発することで、「o1」を含む好きなモデルをユーザーが使って、完全にローカルでカスタマイズされたAIエージェントを利用できるようになるのではないか、というのがウルフ氏らの目指すところだといいます。

まずウルフ氏らは、シンプルなテキストベースのブラウザーとテキスト・インスペクターツールキットを使ってウェブ上のファイルを読み取る仕組みを構築し、Deep researchに近い性能を出そうとしました。この取り組みはDeep researchの公開から24時間以内に実現されました。

ウルフ氏らによると、Deep researchが平均67.36%のスコアを記録したベンチマーク「GAIA」で、Open Deep Researchは54%のスコアに達したとのことです。差は歴然ですが、ウルフ氏らは「これは始まりに過ぎず、改善すべき点はたくさんあります」と述べて開発を継続する意向を示しています。

以下のURLからOpen Deep Researchのデモ版にアクセスでき、「Your request」と書かれた部分にプロンプトを入力してエンターキーを押すことでOpen Deep Researchの回答を得ることができます。

open Deep Research - free the AI agents!
https://m-ric-open-deep-research.hf.space/


ただし、実際に試したところ世界中のユーザーからのキューが90件以上たまっており、さらに回答生成まで1万1394秒(約3時間)待たされるという状況でした。


しかし、ウルフ氏らはこの体験を改善することに全力を注いでおり、ソースコードをGitHubで公開し、閲覧やフィードバックができるようにしているとのことです。

smolagents/examples/open_deep_research at main · huggingface/smolagents · GitHub
https://github.com/huggingface/smolagents/tree/main/examples/open_deep_research

この記事のタイトルとURLをコピーする

・関連記事
OpenAIがあらゆるウェブサイトでのタスクをAIに依頼できる「Operator」を発表 - GIGAZINE

ジャック・ドーシー率いる決済サービス「Block」がAIエージェント「Goose」を発表 - GIGAZINE

DeepSeekが画像生成モデル「Janus Pro」をMITライセンスで公開、DALL-E 3を超える性能と自負 - GIGAZINE

最高でも回答精度9%程度だった「人類最後の試験」でOpenAIのDeep researchが26%以上を記録 - GIGAZINE

in ソフトウェア, Posted by log1p_kr

You can read the machine translated English article Hugging Face is developing an open versi….