ChatGPT・Claude・Geminiに「冷戦下の戦略会議」をさせたら核兵器を使用してしまったという研究結果

AIの研究開発が急速に進む中で、AIを軍事的な戦略・戦術決定に活用する動きも見え始めています。キングス・カレッジ・ロンドンで政治心理学やAIについて研究するケネス・ペイン教授は「GPT-5.2」「Claude Sonnet 4」「Gemini 3 Flash」で核保有国同士の戦争戦略会議をシミュレーションさせる実験を行い、その結果を報告しています。
[2602.14740] AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises
https://arxiv.org/abs/2602.14740
Shall we play a game? - by Kenneth Payne - Ken’s Substack
https://www.kennethpayne.uk/p/shall-we-play-a-game
アメリカ国防省はAIの軍事利用に関する契約をAnthropicと締結しており、2026年2月にAnthropicとの関係が悪化してからはOpenAIと協力関係を築いています。すでにアメリカ軍はAIを作戦に活用しており、2026年2月28日にアメリカがイランに先制攻撃を仕掛けた際にはAnthropicのClaudeが作戦支援に用いられたことが報じられています。
アメリカ軍がイランへの先制攻撃にAI「Claude」を使用したとの報道、開発元のAnthropicとの関係断絶宣言の直後に - GIGAZINE

ペイン教授はAIが核戦争に関する議題をどのように処理するか調査するべく、OpenAIの「GPT-5.2」、Anthropicの「Claude Sonnet 4」、Geminiの「Gemini 3 Flash」を対象に「冷戦に直面した核保有国の戦略を決定する」というシミュレーションを実施しました。
以下のグラフは各種AIが「Signaling(核使用のほのめかし)」「Tactical(戦術核の使用)」「Strategic Threat(戦略核使用のほのめかし)」「Strategic War(全面核戦争)」に至った割合を示しており、緑がClaude Sonnet 4、赤がGPT-5.2、青がGemini 3 Flashの結果を表しています。戦術核の使用に至る確率はClaude Sonnet 4が11%、GPT-5.2が5%、Gemini 3 Flashが10%で、GPT-5.2とGemini 3 Flashは1%の確率で全面核戦争を開始してしまいました。

「締め切りなし」「締め切りあり」という異なる条件での「Claude Sonnet 4」「GPT-5.2」「Gemini 3 Flash」の核使用動向を示した図が以下。GPT-5.2は締め切りを設けなかった場合は核使用をほのめかす程度だったのですが、締め切りを設けると核使用に至る割合が急増しました。

ペイン教授によると、各種AIには明確な行動様式の違いがあったとのこと。具体的には、Claude Sonnet 4は「冷戦相手に対する態度と内部での作戦立案時の態度を使い分ける」、GPT-5.2は「一環してエスカレーションを避ける」、Geminiは「あえて敵に『指導者は非合理的できまぐれな考え方をしている』と思い込ませる狂人理論に沿った行動をする」といった行動を見せたそうです。
ペイン教授は今回の研究成果について「実際にAIに核兵器の発射権限が渡されているわけではないが、今後は戦闘における意思決定にAIが広く用いられるようになるため、今回のような研究が必要となる」と述べています。
ペイン教授の研究はニュース共有サイトのHacker Newsでも話題となっており、「攻撃目的で核兵器が使用された例は広島と長崎のみで、核に関する情報はほとんど極秘扱いである。このため、AI学習に用いられるデータセットには核について扱ったフィクションの方が多く含まれており、AIはフィクション作品に登場する悪役のように振る舞うようになる。AIの出力や有益ではあるが、それらはあくまで物語であり、意図はない」という指摘も投稿されています。
・関連記事
アメリカ軍がイランへの先制攻撃にAI「Claude」を使用したとの報道、開発元のAnthropicとの関係断絶宣言の直後に - GIGAZINE
トランプ大統領が「Anthropicの左翼狂信者がアメリカ軍の制御を試みた」と主張し関係断絶を指示、ヘグセス国防長官はAnthropicを「サプライチェーンリスク」に指定へ - GIGAZINE
OpenAIが国防総省とのAI利用契約について合意、Anthropicの交渉決裂直後に - GIGAZINE
Anthropicがアメリカ政府の指示で「Claude Fable 5」と「Claude Mythos 5」の提供を停止 - GIGAZINE
「DeepSeek V4 Proはアメリカの主要AIモデルに比べて約8カ月遅れているが現状最も高性能な中国製AIモデル」とアメリカ政府のAIリスク管理機関であるCAISIが報告 - GIGAZINE
AIによる「自律型戦争」は既に始まっている、Anthropicと国防総省との争いが自律型AI兵器のリスクを浮き彫りに - GIGAZINE
イスラエルがイランの監視カメラ映像をAIで分析してハメネイ師の位置を特定したことを受けてロシアはプーチン大統領を警護する監視システムの一部を一時停止 - GIGAZINE
・関連コンテンツ
in AI, Posted by log1o_hf
You can read the machine translated English article A study found that when ChatGPT, Claude,….







