無料で簡単にAIエージェントでブラウザやファイルの自動操作ができる「Agent Zero」、ChatGPT・Claude・Geminiと連携できローカルAIも使用可能

ユーザーの指示に応じてOSをツールとして使い、情報収集やコード実行、他エージェントとの協調などを通じてタスク達成を目指すオープンソースのパーソナルAIエージェントフレームワーク「Agent Zero」が公開されています。
agent0ai/agent-zero: Agent Zero AI framework
https://github.com/agent0ai/agent-zero
Agent Zero AI: Open Source Agentic Framework & Computer Assistant
https://www.agent-zero.ai/
Agent Zero Showcase [redacted] - YouTube

Agent Zeroはあらかじめ特定用途向けに固定されたエージェントではなく、汎用(はんよう)的なパーソナルアシスタントとして設計されています。ユーザーからタスクを与えると、情報を集め、コマンドやコードを実行し、必要に応じて他のエージェントインスタンスと協力しながら、目的の達成を試みます。また、過去の解決策やコード、事実、指示などを記憶する永続メモリを備えており、将来のタスクをより速く、より確実に処理しやすくなるとされています。
Agent ZeroはOSそのものを道具として扱うのが大きな特徴。単一目的の専用ツールを最初から多数組み込んでいるわけではなく、自らコードを書き、ターミナルを使って必要な道具を作成、利用できます。既定のツールとしては、オンライン検索、メモリ機能、ユーザーや他のエージェントとの通信、コードとターミナルの実行などが用意されており、それ以外の機能はエージェント自身が作るか、ユーザー側で拡張できます。

拡張性の面では、Anthropicが開発したオープンな「SKILL.md」標準に基づくスキルシステムを採用しています。これは必要な場面で動的に読み込まれる文脈依存の専門機能で、Claude CodeやCursor、Goose、OpenAI Codex CLI、GitHub Copilotなどとの互換性がうたわれています。さらに、GitベースのProjects機能により、公開および非公開リポジトリを認証付きでクローンし、隔離されたワークスペースで扱える点も特徴です。
また、Agent Zeroはマルチエージェント協調にも対応しています。各エージェントには上位エージェントが存在し、最上位の「Agent 0」にとっての上位は人間のユーザーです。各エージェントは下位エージェントを生成してサブタスクを分担させることができ、コンテキストを整理しながら問題を分解して進められる仕組みになっています。

フレームワーク自体は強く固定されておらず、ほとんど何もハードコードされていない点も特徴です。挙動の中心はprompts/default/agent.system.mdにあるシステムプロンプトで定義されており、promptsフォルダ内の各種プロンプトや、python/tools内の既定ツールを変更、複製することで大きく振る舞いを変えられます。環境変数A0_SET_を使った自動設定にも対応しています。
ユーザーインターフェースとしては、クリーンでインタラクティブなウェブUIが提供されています。チャットはUI内で保存や読み込みができ、ターミナルで見える出力は各セッションごとにlogsフォルダへHTMLとして自動保存されます。応答はリアルタイムでストリーミング表示されるため、ユーザーは途中経過を読みながら必要に応じて介入できます。設定項目も用意されており、エージェントの挙動や応答を用途に合わせて調整できます。

そのほか、Dockerベースでの実行に対応しているほか、Speech-to-TextやTTSも案内されています。更新履歴では、LangChainをLiteLLMへ置き換えたことにより、より多くのプロバイダーへの対応が進められており、ChatGPTやClaude、Geminiなどを含む複数のモデルプロバイダーを扱える構成になっています。さらに、モデル設定ではAzureやローカル、カスタムプロバイダー向けのAPI URL指定にも対応しています。

ただし、Agent Zeroは指示次第でコンピュータやデータ、アカウントに関わる潜在的に危険な操作も実行し得るので注意が必要。Agent Zeroの開発チームはDockerのような隔離環境で実行することを強く推奨しています。
・関連記事
TencentがOpenClawっぽくAIエージェントを使えるAIツール「WorkBuddy」リリース - GIGAZINE
AIで簡単にウェブページ上でさまざまなタスクを実行できるようになる「PageAgent」を使ってみた - GIGAZINE
中国で「OpenClaw」ブーム到来、AI研究機関がOpenClawの導入支援ツールを公開して深圳ではOpenClawの初期設定を求める長蛇の列も - GIGAZINE
NVIDIAがオープンソースAIエージェントプラットフォーム「NemoClaw」の提供を予定しているとの報道、OpenClaw風のツールか - GIGAZINE
ユーザーのチャット履歴を使って「顧客のAIエージェントツイン」を作成して市場調査に生かす企業が登場 - GIGAZINE
OpenAIが脆弱性の発見・検証・修正を自動化するAIエージェント「Codex Security」を発表 - GIGAZINE
Google Workspace CLIリリース、Googleドライブ・Gmail・Googleスプレッドシート・Googleドキュメントなどを1つのコマンドラインツールで一括管理可能&AIエージェントのスキルもあり - GIGAZINE
・関連コンテンツ
in AI, 動画, ソフトウェア, Posted by log1i_yk
You can read the machine translated English article 'Agent Zero' allows you to easily and fr….







