2026年05月01日 12時05分 AI

GPT-5.5が「ネットワーク完全乗っ取り攻撃」を自律的に成功、Claude Mythos Previewに続いて2例目

イギリスの政府系機関・AI Security Institute(AISI)によるサイバー攻撃性能の検証で、GPT-5.5が「ネットワーク完全乗っ取り攻撃」を成功させられる性能を持っていることが明らかになりました。

Our evaluation of OpenAI's GPT-5.5 cyber capabilities | AISI Work
https://www.aisi.gov.uk/blog/our-evaluation-of-openais-gpt-5-5-cyber-capabilities

OpenAI’s GPT-5.5 is the second model to complete one of our multi-step cyber-attack simulations end-to-end 🧵 pic.twitter.com/eQWYbYaa6w
— AI Security Institute (@AISecurityInst) April 30, 2026

AISIは複数のテストを継続的に実施してAIのサイバー攻撃性能の変遷を記録しています。2026年4月にリリースされた「Claude Mythos Preview」は高い精度を見せ、企業のネットワークに対する乗っ取り攻撃をシミュレートした「The Last Ones(TLO)」というテストも完遂しました。TLOの攻撃テストは32段階に分かれており、人間なら20時間を要し、これまでのAIモデルでは完遂例がありませんでした。

「Claude Mythos Preview」はネットワーク完全乗っ取り攻撃を自律的に実行できてしまうことがイギリス政府機関のテストで判明 - GIGAZINE

今回AISIは「Mythos PreviewがTLOに成功したのは、特定モデルのみ限定のブレイクスルーなのか、AI全般の流れなのか」の確認も含めて、OpenAIがリリースしたGPT-5.5の評価を行いました。

OpenAIが「GPT-5.5」をリリース、Claude Opus 4.7を上回る性能 - GIGAZINE

以下のグラフは縦軸が完了したステップ数、横軸が累積トークン数で、GPT-5.5はMythos Previewと同じく平均すると32あるステップのうち22まで到達。点線で示されているのは最良の結果で、GPT-5.5はMythos Previewに続いてTLOに成功しました。Mythos Previewは10回の試行のうち3回、GPT-5.5は10回の試行のうち2回が成功でした。

GPT-5.5はTLO以外のテストでも高い成績を収めています。ターゲットシステムの隠された情報を取得するキャプチャー・ザ・フラッグ(CTF)形式のサイバー攻撃性能テストのうち、上から2番目の「Practitioner(実務者)」と最高難度の「Expert(熟練者)」の成功率をモデルのリリース時期とともにグラフ化したものが以下。上の少し色が薄い点線と丸印が実務者レベル、下の色が濃い点線と丸印が熟練者レベルの結果で、青く囲ったMythos Previewより、赤く囲ったGPT-5.5の方が少し成功率が上がっています。GPT-5.5の熟練者レベルの平均成功率は71％だったとのこと。

「カスタム仮想マシンをリバースエンジニアリングする」という最も難度の高い課題は、人間の専門家の場合12時間ほどかかるのですが、GPT-5.5は1.73ドル(約272円)かけて11分未満で解決しました。

今回の結果についてAISIは、あくまで制御された環境下での能力評価であり、テスト環境にアクティブな防御者や防御ツールが不足しているため、十分に防御された標的に対してGPT-5.5が攻撃を成功させられるかどうかは判断できないと述べました。

These are capability evaluations in controlled settings. Our current test environments lack active defenders and defensive tooling. We cannot say from these results whether GPT-5.5 would succeed against well-defended targets.
— AI Security Institute (@AISecurityInst) April 30, 2026