2025年02月05日 12時10分ソフトウェア

OpenAIのAIエージェント「Deep research」のオープン版をHugging Faceが開発中

OpenAIが発表した、インターネット上の情報を検索して推論を行うAIエージェント「Deep research」のオープン版を、AI開発プラットフォームHugging Faceの開発者らが構築していることがわかりました。

Open-source DeepResearch – Freeing our search agents
https://huggingface.co/blog/open-deep-research

Introducing open-Deep-Research by @huggingface ! 💥

Deep Research from @OpenAI is really good... But it's closed, as usual.

> So with a team of cracked colleagues, we set ourselves a 24hours deadline to replicate and open-source Deep Research!

➡️ We built open-Deep-Research,… pic.twitter.com/GE9tvjW0BA
— Aymeric (m-ric) (@AymericRoucher) February 4, 2025

Hugging Face researchers aim to build an 'open' version of OpenAI's deep research tool | TechCrunch
https://techcrunch.com/2025/02/04/hugging-face-researchers-aim-to-build-an-open-version-of-openais-deep-research-tool/

Deep researchはインターネット上の情報を検索可能なAIエージェントで、「コンテンツの発見」「コンテンツの統合」「情報についての推論」という3つの主要な機能を備えています。Deep researchはChatGPTに統合されて一般に利用できるようになる予定で、既にサブスクリプションサービスのChatGPT Proで使えるようになっています。

ChatGPTはインターネット上の情報を検索することができず、あらかじめ与えられた情報のみを使ってユーザーのリクエストに応えることしかできませんでしたが、Deep researchが統合されることで、より柔軟にユーザーのリクエストを処理できるようになることが期待されています。

OpenAIがChatGPTにオンライン上の情報を収集させる「Deep research」機能を搭載すると発表 - GIGAZINE

ところが、Deep researchは記事作成時点で有料会員しか利用できず、今後のロードマップでも各種有料会員向けに順次展開されることしかわかっていません。

こうした状況の中、Hugging Faceの共同設立者兼チーフ・サイエンティストであるトーマス・ウルフ氏ら開発者グループが、Deep researchの「オープン」版である「Open Deep Research」を構築していることがわかりました。

ウルフ氏らによると、大本のDeep researchは「大規模言語モデル(OpenAI 4o、o1、o3など)」と「エージェントフレームワーク」で構成されているとのこと。エージェントフレームワークはAIシステムに組み込まれたツールで、LLMがウェブサイトを閲覧したり、PDFファイルを読んだりするために使われます。

OpenAIがDeep researchの基礎となるエージェントフレームワークについてあまり公表していないことに目を付けたウルフ氏らは、このエージェントフレームワークをオープンソースで独自に作成することにしました。

Open Deep Researchは、OpenAIの「o1」とオープンソースのエージェントフレームワークで構成されています。o1はプロプライエタリなモデル、つまり有料のAPIで保護されているものですが、エージェントフレームワークの方はオープンなのが特徴です。エージェントフレームワークをオープンソースで開発することで、「o1」を含む好きなモデルをユーザーが使って、完全にローカルでカスタマイズされたAIエージェントを利用できるようになるのではないか、というのがウルフ氏らの目指すところだといいます。

まずウルフ氏らは、シンプルなテキストベースのブラウザーとテキスト・インスペクターツールキットを使ってウェブ上のファイルを読み取る仕組みを構築し、Deep researchに近い性能を出そうとしました。この取り組みはDeep researchの公開から24時間以内に実現されました。

ウルフ氏らによると、Deep researchが平均67.36％のスコアを記録したベンチマーク「GAIA」で、Open Deep Researchは54％のスコアに達したとのことです。差は歴然ですが、ウルフ氏らは「これは始まりに過ぎず、改善すべき点はたくさんあります」と述べて開発を継続する意向を示しています。

以下のURLからOpen Deep Researchのデモ版にアクセスでき、「Your request」と書かれた部分にプロンプトを入力してエンターキーを押すことでOpen Deep Researchの回答を得ることができます。

open Deep Research - free the AI agents!
https://m-ric-open-deep-research.hf.space/

ただし、実際に試したところ世界中のユーザーからのキューが90件以上たまっており、さらに回答生成まで1万1394秒(約3時間)待たされるという状況でした。

しかし、ウルフ氏らはこの体験を改善することに全力を注いでおり、ソースコードをGitHubで公開し、閲覧やフィードバックができるようにしているとのことです。

smolagents/examples/open_deep_research at main · huggingface/smolagents · GitHub
https://github.com/huggingface/smolagents/tree/main/examples/open_deep_research