AI

「Claude Mythos Preview」はネットワーク完全乗っ取り攻撃を自律的に実行できてしまうことがイギリス政府機関のテストで判明


AI企業のAnthropicは2026年4月27日にAIモデル「Claude Mythos Preview」を発表しました。Claude Mythos Previewはサイバー攻撃性能が高すぎることから一般公開はされておらず、一部の組織を対象にサイバーセキュリティの強化を目的として限定公開されています。そんなClaude Mythos Previewについて、イギリスの政府機関であるAI Security Institute(AISI)がサイバー攻撃性能の検証結果を公開しました。

Our evaluation of Claude Mythos Preview’s cyber capabilities | AISI Work
https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities

Claude Mythos PreviewはClaude Opus 4.6を大きく上回る推論性能とコーディングエージェント性能を備えたAIモデルで、最大の特長は「サイバー攻撃性能が高い」という点です。Claude Mythos PreviewはLinuxカーネルやFirefoxといった著名なソフトウェアに存在する脆弱(ぜいじゃく)性を次々に発見し、実際の攻撃に使えるエクスプロイトも作成できてしまうとのこと。AnthropicはClaude Mythos Previewを一般公開せず、サイバーセキュリティの強化を目的とする一部の組織にのみ提供することを決定しました。

サイバー攻撃性能が高すぎるAI「Claude Mythos Preview」をAnthropicが開発、プレビュー版をMicrosoftやAppleなどに提供する「Project Glasswing」も開始 - GIGAZINE


AISIはClaude Mythos Previewを含む各種AIモデルを対象に、ターゲットシステムの脆弱性を悪用して隠された情報を取得するキャプチャー・ザ・フラッグ(CTF)形式のサイバー攻撃性能テストを実施しました。テストは「Technical non-epart(非専門家)」「Apprentice(見習い)」「Practitioner(実務者)」「Expert(熟練者)」の4種類の難度が用意されました。

非専門家レベルのテスト(緑)と見習いレベルのテスト(青)の結果が以下。横軸がAIモデルのリリース時期、縦軸がCTFの成功率を示しています。結果が頭打ちになっている非専門家レベルのテストではGPT-5が最も高い成功率を記録しましたが、見習いレベルのテストではClaude Mythos Previewが最も高い成功率を記録しました。


実務者レベルのテスト(青)と専門家レベルのテスト(黒)の結果が以下。Claude Mythos Previewは専門家レベルのテストで73%という高い成功率を記録しました。


さらに、AISIは「The Last Ones(TLO)」と名付けたテストも実施しました。TLOは初期偵察からネットワークの完全掌握までを網羅する32段階の企業ネットワーク攻撃シミュレーションをAIに自律的に実行させるテストです。TLOのテスト内容は人間なら20時間を要すると推定されています。

TLOの結果を示したグラフが以下。横軸が消費トークン数で、縦軸が完了ステップ数を示しています。他のモデルは1億トークンを費やしてもTLOを完了することができませんでしたが、Claude Mythos Previewは10回の試行のうち3回でTLOを完了することに成功。10回の平均到達ステップ数は22でした。また、テストは1億トークンで終了しましたが、Claude Mythos Previewのタスク進行度は頭打ちになっておらず、さらに多くのトークンを費やせば到達ステップ数が向上すると推測されています。


AISIは「Claude Mythos Previewは少なくともネットワークへのアクセス権を取得して小規模かつ脆弱なエンタープライズシステムに対して自律的な攻撃を実行できることが示されました」と述べています。一方で、今回のテスト内容には「AIモデルがセキュリティアラートをトリガーする行動を取ってもペナルティがない」といった制約があったとのこと。このため、AISIは「アクティブなセキュリティツールやセキュリティ担当者が存在する十分に防御されたシステム」を攻撃できるかどうかは断言できないと指摘しています。

この記事のタイトルとURLをコピーする

・関連記事
サイバー攻撃性能が高すぎるAI「Claude Mythos Preview」をAnthropicが開発、プレビュー版をMicrosoftやAppleなどに提供する「Project Glasswing」も開始 - GIGAZINE

正体不明のハッカーがAI「Claude」を使い1億9500万件の納税者記録など150GBのメキシコ政府データを盗み出したことが発覚 - GIGAZINE

「Claude Code Security」が登場、コード内の脆弱性をスキャンして修正提案もしてくれる - GIGAZINE

OpenAIが脆弱性の発見・検証・修正を自動化するAIエージェント「Codex Security」を発表 - GIGAZINE

in AI,   セキュリティ, Posted by log1o_hf

You can read the machine translated English article Tests by a UK government agency revealed….