ソフトウェア

さまざまなゲームを人間のようにプレイ可能なAIをDeepMindが開発、マルチプレイにも対応


世界最強の棋士を打ち負かした囲碁AI「AlphaGo」やタンパク質構造解析アルゴリズム「AlphaFold」を開発したことで知られるAI開発企業のDeepMindが、「まったくルールの異なるゲームにも対応できるAI」を開発したことを発表しました。

Open-Ended Learning Leads to Generally Capable Agents | DeepMind
https://deepmind.com/research/publications/open-ended-learning-leads-to-generally-capable-agents

Generally capable agents emerge from open-ended play | DeepMind
https://deepmind.com/blog/article/generally-capable-agents-emerge-from-open-ended-play

DeepMindが開発した囲碁AI「AlphaGo」は、世界最強の棋士を打ち負かした後も進歩を続け、2017年には囲碁だけでなく将棋やチェスの対局にも対応した「AlphaZero」が登場。このAlphaZeroを用いて「変則的なルールを学習させることで、新たなチェスのルールを作り出す」といった試みも行われています。

人間を倒してチェスのあり方を一変させたAIが「チェスの新たな可能性を広げる」ために使われている - GIGAZINE


しかし、DeepMindよるとAlphaZeroは囲碁・将棋・チェスといった複数のゲームの対応しているものの、それぞれのゲームごとに異なる学習が必要になるとのこと。DeepMindは「私たちは、AlphaZeroの限界を克服して、適応力の高いAIエージェントを開発する方法を模索しました」「新たに開発したAIは、特定のタスクに特化するのではなく、多くのタスクに広く適用できる動作を習得できます。これは、変化し続ける状況に素早く対応できるAIを開発するための重大な一歩です」と述べ、あらゆるゲームに対応可能なAIを開発したことを発表しました。

今回開発されたAIは、一人称視点のキャラクターを操作するように設計され、「旗取りゲーム」「かくれんぼ」「色合わせゲーム」といったマルチプレイゲームで比較的単純な目標を達成する方法を学習しました。AIに与えられた目標は、旗取りゲームでは「黄色い立方体を定められたエリアへ運ぶ」、かくれんぼでは「敵プレイヤーの視界に入らない」、色合わせゲームでは「同じ色の物体を近づける」というように学習するゲームごとに異なります。さらに、ゲームのステージはプログラムによってランダムに変更可能となっており、AIは自分が操作するキャラクターの周囲の色情報からステージのマップを把握する方法も学習しました。


上記の方法でAIに2000億回の学習を施した結果、AIが「特定のタスクに対して高度に最適化された動作」ではなく、「人間のように経験則で判断しているかのような動作」を示すようになったとのこと。また、AIは「マップ内の物体を用いて、他のプレイヤーの視界をさえぎる」といったマルチプレイならではの動きも習得しました。

以下のムービーでは、実際に今回開発されたAIがゲームをプレイする様子を確認できます。

Open-Ended Learning Leads to Generally Capable Agents | Results Showreel - YouTube


「かくれんぼ」では、青プレイヤーは赤プレイヤーを視界に入れることを目的とし、赤プレイヤーは青プレイヤーの視界から逃れることを目的とします。


ムービーには、マップを上から見たと映像と、青プレイヤー視点映像が表示されています。ゲーム開始直後は青色のプレイヤーが赤色のプレイヤーを視界にいれ続けていますが……


ゲーム開始からしばらく経過すると、赤プレイヤーが青プレイヤーの視界から脱出。


その後、赤プレイヤーはマップの奥へと逃げることに成功しました。


旗取りゲームでは、両プレイヤーが自分の色に合った土台の上に、2つの立方体を運び込むことを目的とします。


プレイヤーは、ビームを使って敵プレイヤーを倒すことができます。実際にゲームがスタートすると、開始直後から激しいビームの応酬。


最後には、青プレイヤーが自陣に立方体を運びこむことに成功しました。


次のゲームでは、両プレイヤーは紫色の四角錐に触れることを目的とします。


紫色の四角錐に触れる方法は多く存在。例えば大きな板状の物体で坂道を作ったり……


紫色の四角錐に物体を当てて、低い位置に落としたりと、AIがさまざまな方法で目的を達成する様子を確認できます。今回開発されたAIは、単一のゲームに特化したわけではなく、以上のゲーム全てに習熟しています。


なお、DeepMindは研究に興味を持った人に対して、研究への参加を呼びかけています。

この記事のタイトルとURLをコピーする

・関連記事
世界最強の囲碁AIを開発したDeepMindが「人間を超越したFPSプレイヤー」のAIを開発 - GIGAZINE

人工知能企業DeepMindがタンパク質構造解析アルゴリズム「AlphaFold」をオープンソースで公開、誰でも利用可能に - GIGAZINE

50年前からの生物学の超難問にDeepMindの開発した「AlphaFold」がAIのパワーで道筋を示し研究が加速 - GIGAZINE

囲碁AI「AlphaGo」に敗北した世界チャンピオンが「AIを負かすことはできない」と棋士を引退 - GIGAZINE

トップ棋士に勝つ囲碁AIを開発したDeepMindはサッカーでのAI活用を目指してリヴァプールFCと協力している - GIGAZINE

DeepMindのAIは人間の医師と同等の精度で目の病気を診断できる - GIGAZINE

in ソフトウェア,   サイエンス,   動画,   ゲーム, Posted by log1o_hf

You can read the machine translated English article here.