2026年04月02日 12時07分 AI

Claude Codeのソースコード流出によって明らかになったAnthropicの開発プロジェクトとは？

2026年3月31日、AnthropicのコーディングAIエージェント・Claude Codeのソースコードが流出する事件が起きました。このソースコードを解析した結果、Anthroipicが開発中あるいは無効化していた機能の存在が明らかとなりました。

Here's what that Claude Code source leak reveals about Anthropic's plans - Ars Technica
https://arstechnica.com/ai/2026/04/heres-what-that-claude-code-source-leak-reveals-about-anthropics-plans/

Anthropicは3月31日にClaude Codeのnpmパッケージのバージョン2.1.88を公開しましたが、そのパッケージにはソースマップファイルが含まれており、それを使ってClaude Codeのソースコード全体にアクセスできることが、セキュリティ研究者のChaofan Shou氏による指摘で判明しました。

Claude code source code has been leaked via a map file in their npm registry!

Code: https://t.co/jBiMoOzt8G pic.twitter.com/rYo5hbvEj8
— Chaofan Shou (@Fried_rice) March 31, 2026

Anthropicは複数のメディアに対し、「Claude Codeのリリースに内部ソースコードが混入していました。機密性の高い顧客データや認証情報は一切含まれておらず、流出もありませんでした。これはセキュリティ侵害ではなく、人為的なミスによるリリースパッケージングの問題です。再発防止策を講じています」とコメントし、このコードが本物であることを認めています。

そして、2000以上のファイルにわたる51万2000行以上のコードが有志によって精査されたことで、開発中のものを含めた新たな機能が明らかとなりました。

その1つが、Claude Codeのターミナルウィンドウが閉じられている場合でもバックグラウンドで動作し続けるようにする「KAIROS」です。

KAIROSは一定間隔で状況を見直す仕組みで、という定期的なプロンプトを用いて「新たなアクションが必要かどうか」を継続的に確認します。さらにPROACTIVEというフラグもあり、これは「ユーザーがまだ頼んでいないが、今見せるべきことがある」と判断した情報を表に出します。通常、AIコーディングアシスタントはユーザーの明示的なコマンドを受けて動作するようになっていますが、KAIROSはその場限りの対話補助ではなく、セッションをまたいで継続的に動作し、必要に応じて自律的に仕事を進めることを想定した設計となっているというわけです。

そのためにKAIROSはユーザーとのセッションをまたいで状態を保持するため、ファイルベースの「メモリーシステム」を使う設計になっているとのこと。無効化されたKAIROSフラグの背後にあるプロンプトには、「ユーザーがどんな人物か」「どう協業したいか」「避けるべき振る舞いと繰り返すべき振る舞いは何か」「ユーザーから渡された仕事の背景は何か」といった情報を総合的に把握することが目的だと書かれていたそうで、これは単なる会話履歴の保存ではなく、ユーザーとの付き合い方そのものを長期的に学習していく設計だといえます。

さらに、その記憶を整理するために「AutoDream」という仕組みも参照されています。

AutoDreamは、ユーザーがしばらく操作しなくなった時や、セッション終了時に手動で休止を指示した時に、Claude Codeが「dream」と呼ばれる振り返り処理を行うもの。つまり、その日の会話記録から「保存する価値のある新情報」を探し、似た内容の重複や矛盾を避けながら統合し、冗長になった記憶や古くなった記憶を削るようになっています。また、既存の記憶が少しずつズレていく現象にも注意するよう指示があり、これは将来のセッションで素早く状況をつかめるよう、耐久性のある整理済みメモリーに作り替えることが狙いだと考えられます。

さらに、Anthropicの社員が公開オープンソースのリポジトリに参加する際、AIエージェントであることを明かさずに作業することを想定した「Undercover mode」というモードが発見されました。

Undercover modeのプロンプトでは、コミットメッセージやPRの本文にAnthropic内部の情報を含めないよう強く指示しており、内部のモデル名やプロジェクト名、内部ツール名、Slackチャンネル名などを外に出さないことが求められています。さらに、「Claude Code」という語句や、自分がAIであることを示す記述を入れてはならないこと、共同執筆者を示すco-authored-byのような帰属表示も省くことが明記されていました。

IT系ニュースサイトのArs Technicaは、こうした匿名化や秘匿化の指示はAIコーディング支援ツールの利用をめぐる最近の論争とも関係しそうだと述べています。ただし、Undercover modeは存在こそ確認できるものの、無効化されており稼働はしていなかった模様。

「Buddy」はもっと警備な機能として、Microsoft Officeで登場したイルカのように、ユーザーの入力欄のそばに座り、ときどき吹き出しでコメントする存在だとのこと。見た目はアスキーアートによる小さなキャラクターで、以下のような猫を模したものもあったそうです。

このBuddyは4月1日から7日の間に先行公開し、5月に本格公開する計画があったことも示唆されていますが、ソースコード流出がその予定にどう影響したかは不明だとArs Techinicaは述べています。

加えて、将来的に実装が検討されていた可能性のある要素として「UltraPlan」「Voice Mode」「Bridge mode」「Coordinator tool」の4つが挙げられています。

UltraPlanは、Opus級のClaudeモデルに「高度な計画」を下書きさせ、それをユーザーが編集して承認できるようにする機能。この処理ｇ1回あたり10分から30分動作しうるとされており、単なる短い応答生成ではなく、やや時間のかかる本格的な計画立案を想定していることがうかがえるとのこと。つまり、ユーザーが最終判断を下す前提で、AI側が複雑な作業手順や実装計画のたたき台をかなり踏み込んで作る機能だと考えられます。

Voice Modeは、Claude Codeに対して音声で直接話しかけられるようにする機能で、他の類似AIシステムのようにユーザーがClaude Codeと直接会話できる仕組みとなっています。

Bridge modeは既存のAnthropic Dispatchを拡張する形で、リモートのClaude Codeセッションを外部のブラウザやモバイル端末から完全に操作できるようにする機能です。Claude Codeを動かしている環境の前にいなくても、別の端末から接続して状態を確認したり操作を継続したりできるようにする可能性が示唆されています。

Coordinator toolは複数のワーカーを並列に立ち上げて、ソフトウェアエンジニアリング上のタスクを「オーケストレーション」するための仕組み。また、これらの並列プロセスがWebSocketsを通じて通信できる可能性もあります。1つのAIが1つの作業を順番にこなすのではなく、複数の作業担当を同時に走らせ、それらをまとめ役が調整するような、より分散的で大規模な開発支援を想定していた機能といえます。