さまざまなゲームを人間のようにプレイ可能なAIをDeepMindが開発、マルチプレイにも対応
世界最強の棋士を打ち負かした囲碁AI「AlphaGo」やタンパク質構造解析アルゴリズム「AlphaFold」を開発したことで知られるAI開発企業のDeepMindが、「まったくルールの異なるゲームにも対応できるAI」を開発したことを発表しました。
Open-Ended Learning Leads to Generally Capable Agents | DeepMind
https://deepmind.com/research/publications/open-ended-learning-leads-to-generally-capable-agents
Generally capable agents emerge from open-ended play | DeepMind
https://deepmind.com/blog/article/generally-capable-agents-emerge-from-open-ended-play
DeepMindが開発した囲碁AI「AlphaGo」は、世界最強の棋士を打ち負かした後も進歩を続け、2017年には囲碁だけでなく将棋やチェスの対局にも対応した「AlphaZero」が登場。このAlphaZeroを用いて「変則的なルールを学習させることで、新たなチェスのルールを作り出す」といった試みも行われています。
人間を倒してチェスのあり方を一変させたAIが「チェスの新たな可能性を広げる」ために使われている - GIGAZINE
しかし、DeepMindよるとAlphaZeroは囲碁・将棋・チェスといった複数のゲームの対応しているものの、それぞれのゲームごとに異なる学習が必要になるとのこと。DeepMindは「私たちは、AlphaZeroの限界を克服して、適応力の高いAIエージェントを開発する方法を模索しました」「新たに開発したAIは、特定のタスクに特化するのではなく、多くのタスクに広く適用できる動作を習得できます。これは、変化し続ける状況に素早く対応できるAIを開発するための重大な一歩です」と述べ、あらゆるゲームに対応可能なAIを開発したことを発表しました。
今回開発されたAIは、一人称視点のキャラクターを操作するように設計され、「旗取りゲーム」「かくれんぼ」「色合わせゲーム」といったマルチプレイゲームで比較的単純な目標を達成する方法を学習しました。AIに与えられた目標は、旗取りゲームでは「黄色い立方体を定められたエリアへ運ぶ」、かくれんぼでは「敵プレイヤーの視界に入らない」、色合わせゲームでは「同じ色の物体を近づける」というように学習するゲームごとに異なります。さらに、ゲームのステージはプログラムによってランダムに変更可能となっており、AIは自分が操作するキャラクターの周囲の色情報からステージのマップを把握する方法も学習しました。
上記の方法でAIに2000億回の学習を施した結果、AIが「特定のタスクに対して高度に最適化された動作」ではなく、「人間のように経験則で判断しているかのような動作」を示すようになったとのこと。また、AIは「マップ内の物体を用いて、他のプレイヤーの視界をさえぎる」といったマルチプレイならではの動きも習得しました。
以下のムービーでは、実際に今回開発されたAIがゲームをプレイする様子を確認できます。
Open-Ended Learning Leads to Generally Capable Agents | Results Showreel - YouTube
「かくれんぼ」では、青プレイヤーは赤プレイヤーを視界に入れることを目的とし、赤プレイヤーは青プレイヤーの視界から逃れることを目的とします。
ムービーには、マップを上から見たと映像と、青プレイヤー視点映像が表示されています。ゲーム開始直後は青色のプレイヤーが赤色のプレイヤーを視界にいれ続けていますが……
ゲーム開始からしばらく経過すると、赤プレイヤーが青プレイヤーの視界から脱出。
その後、赤プレイヤーはマップの奥へと逃げることに成功しました。
旗取りゲームでは、両プレイヤーが自分の色に合った土台の上に、2つの立方体を運び込むことを目的とします。
プレイヤーは、ビームを使って敵プレイヤーを倒すことができます。実際にゲームがスタートすると、開始直後から激しいビームの応酬。
最後には、青プレイヤーが自陣に立方体を運びこむことに成功しました。
次のゲームでは、両プレイヤーは紫色の四角錐に触れることを目的とします。
紫色の四角錐に触れる方法は多く存在。例えば大きな板状の物体で坂道を作ったり……
紫色の四角錐に物体を当てて、低い位置に落としたりと、AIがさまざまな方法で目的を達成する様子を確認できます。今回開発されたAIは、単一のゲームに特化したわけではなく、以上のゲーム全てに習熟しています。
なお、DeepMindは研究に興味を持った人に対して、研究への参加を呼びかけています。
・関連記事
世界最強の囲碁AIを開発したDeepMindが「人間を超越したFPSプレイヤー」のAIを開発 - GIGAZINE
人工知能企業DeepMindがタンパク質構造解析アルゴリズム「AlphaFold」をオープンソースで公開、誰でも利用可能に - GIGAZINE
50年前からの生物学の超難問にDeepMindの開発した「AlphaFold」がAIのパワーで道筋を示し研究が加速 - GIGAZINE
囲碁AI「AlphaGo」に敗北した世界チャンピオンが「AIを負かすことはできない」と棋士を引退 - GIGAZINE
トップ棋士に勝つ囲碁AIを開発したDeepMindはサッカーでのAI活用を目指してリヴァプールFCと協力している - GIGAZINE
DeepMindのAIは人間の医師と同等の精度で目の病気を診断できる - GIGAZINE
・関連コンテンツ