2022年12月07日 11時50分ソフトウェア

DeepMindが外交ゲーム「ディプロマシー」で他のプレイヤーと交渉してゲームに勝利できるAIを発表

プロ棋士を破った囲碁AIのAlphaGoなどを手がけるDeepMindが新しく、交渉による合意形成が重要なボードゲームである「ディプロマシー」でコミュニケーションを行い、他のエージェントを打ち負かすことが可能なAIを発表しました。

Negotiation and honesty in artificial intelligence methods for the board game of Diplomacy | Nature Communications
https://doi.org/10.1038/s41467-022-34473-5

AI for the board game Diplomacy
https://www.deepmind.com/blog/ai-for-the-board-game-diplomacy

ディプロマシーは第一次世界大戦前夜のヨーロッパを舞台にしたボードゲームで、ヨーロッパ列強7カ国を担当する各プレイヤーは他国と積極的に外交を行い、同盟を結んで共通の敵を倒したり、時には盟邦を裏切ったりして駆け引きを行うことが求められます。

チェスや囲碁など、1対1のゲームで人間に勝利を収めてきたAIにとって、他のプレイヤーとの複雑な意思疎通や、他のプレイヤーが約束を守るか破るかを見抜く論理的思考を身につけるのは、長年にわたる重要な課題でした。そこで、DeepMindの研究員であるJános Kramár氏らの研究チームは、まずAIエージェントがさまざまな合意の下でゲームがどのように展開するかをシミュレートして、お互いに有益な交渉を選択することができるようにするアルゴリズムを導入しました。

しかし、ディプロマシーでは約束が必ず守られるとは限らないため、エージェントが他のプレイヤーと同盟を結ぶためには、戦略的に契約を破ったらどうなるかを予測する必要があります。この課題に対処するため、研究チームは一度結んだ約束を破ったらどのように信頼関係や協力関係が損なわれるかを調べた上で、約束を破った相手からの報復を予測したり、そうした報復よりも裏切りから得られる利益の方が十分に大きい場合にのみ裏切ったりすることをAIに学習させました。

これにより、DeepMindのAIは他のエージェントとコミュニケーションを取って契約を結んでゲームを有利に展開させることが可能になり、交渉能力を持たないエージェントに対して勝利することができたとのこと。

Kramár氏は今回の研究について、「公平性と透明性を有する、信頼できるAIの構築は極めて重要なテーマですので、ディプロマシーのようなサンドボックスでこれらの問題を研究することは、実世界に存在しうる協力と競争の間のせめぎ合いをより深く理解するのに役立ちます」と述べて、単にゲームに強いAIが作れるだけでなく、人間と信頼関係を構築するAIを作る上で重要な成果が得られたことを強調しました。

複雑な戦略を駆使するAIの能力は日進月歩で発展しており、2022年12月にはDeepMindのAI「DeepNash」が軍人将棋の一種である「ストラテゴ」で専門家を負かすことに成功しています。また、MetaのAI「Cicero」は、ディプロマシーをオンライン対戦でプレイして上位10％にランクインする成績を収めました。

「ウソ」を操って人間を欺き友情破壊ゲーム「ディプロマシー」の上位10％に食い込むAI「Cicero」をMetaが開発 - GIGAZINE