ソフトウェア

アルファ碁を作ったDeepMindが3DゲームをプレイするAI「DeepMind Lab」をオープンソースとして公開


Googleが買収した人工知能開発企業「DeepMind」は囲碁チャンピオンを打ち破った人工知能「AlphaGo(アルファ碁)」を開発したことで知られています。DeepMindは人工知能のさらなる発展に貢献するべく、DeepMindの内部で使われていたフラグシップAIプラットフォーム「DeepMind Lab」をオープンソースとして公開しました。

Open-sourcing DeepMind Lab | DeepMind
https://deepmind.com/blog/open-sourcing-deepmind-lab/

DeepMind Labとは3Dゲームをプレイして学習するAIプラットフォームで、オープンソースとして誰でも使用することができます。以下が与えられた3Dゲームをプレイする「エージェント」で、浮遊する球体のボディを持ち、スラスターを噴射して前後左右の行きたい方向に移動できるほか、ジャンプしたりしゃがんだりといったアクションをこなします。一人称視点のカメラを備えており、カメラを水平(左右)と垂直(上下)に移動して視点を変えることも可能。エージェントはカメラから見た周囲の映像と、ゲーム内で得られる「報酬」や「罰」に基づいて学習し、リアルタイムで意志決定を行います。


プレイさせられる3Dゲームのタスクとしては、「フルーツを収集する」「迷路を進む」「崖から落ちないように危険な細道を進む」「ジャンプ台を使って宇宙空間のステージからステージに飛び移る」「レーザーで印をつけるゲームをプレイする」「ランダムに生成される環境を素早く学習して記憶する」などが挙げられています。

実際にDeepMind Labに「スイカをゲットするとゴール」という3Dゲームをプレイさせているサンプルムービーは以下から見ることができます。

DeepMind Lab - Stairway to Melon Level - YouTube


ゲームがスタートすると、エージェントの目の前にリンゴが並んでいます。


振り返るとレモンも浮かんでいます。


ひとまずエージェントはリンゴの方向へ進むことにした模様。リンゴに接触するとゲットしたフルーツの数が右下にカウントされていきます。


角を曲がるとその先にもいくつかのリンゴが並んでおり……


まっすぐ進んでもう一度角を曲がると、またもリンゴがあります。その先は行き止まりになっており……


目の前まで行って確認すると、段差になっているものの、ジャンプで届く高さではない様子。


少し下がって確認すると、段差の上にスイカがあるのがわかりました。


するとエージェントは来た道を戻っていき……


スタート地点の反対側にあったレモンの方向に進んでいきます。


角を曲がっていくと階段が設置されています。


階段の先にあった角を曲がると、無事スイカにたどり着くことができました。行き止まりで見つけた高所にあるスイカをゲットするため、来た道を戻って階段をのぼるという選択を行ったわけです。


DeepMind Labのエージェントが、難易度の低い迷路ゲームをプレイして学習していく様子もムービーに収められています。

DeepMind Lab - Nav Maze Level 1 - YouTube


スタート地点はこんな感じ。


適当に進んで行くとリンゴがあり、進みながらゲットしていきます。


迷路の壁には目印となる模様や……


赤い壁などが設置されています。


リンゴをゲットしつつ進んで行きますが……


落ちているリンゴもなくなり、同じ道を行ったり来たりしています。


やがて壁の模様から未踏のルートを発見、進んで行くと……


初めてのフルーツを発見。これをゲットすると画面がホワイトアウトし、エージェントは何をすればゴールするのかを学習しました。


2回目のプレイがスタート。目の前には赤い壁があります。


今度はやみくもに行くのではなく、スタート位置からちょっと回って、1回目のプレイでゴール付近にあった黄色い模様を発見。


角を曲がるとやっぱりゴールとなるフルーツがありました。


3回目のプレイがスタート。つまりこれは「同じ形状の迷路を異なるスタート地点から開始するゲーム」と見られます。またも見覚えのある赤い壁があり……


すぐさまゴールすることができました。複数回のプレイによって、エージェントがしっかり学習していたことがわかります。


最後は「宇宙空間に浮かぶ足場をジャンプ台で飛び移っていくレーザータグゲーム」という複数の要素を組み合わせた難易度の高いゲームに挑戦しているムービー。

DeepMind Lab - Laser Tag Space Bounce Level (Hard) - YouTube


スタート地点はこんな感じで、周囲には宇宙空間が広がっており、目の前にはジャンプ台。周囲には異なる高さに複数の足場が見えます。


ジャンプ台のところまで進むと自動的に発射(大ジャンプ)するのですが、飛び上がった先にいたロボットがビームを発射。ビームに当たると真ん中の数字が減少していき……


エージェントが消滅したようなエフェクトが見えてゲームオーバーに。


2回目のプレイでは、最初から目の前に敵ロボットがいてビームを発射してきます。


すぐにジャンプ台に向かって見事回避に成功。


……と思ったら、着地先に2台のロボットが待ち構えており、ビームの掃射をくらってゲームオーバー。


3回目は安全なポイントからスタート。まずはジャンプ台から飛び上がり……


ジャンプ中に周囲を確認しています。


着地先にロボットがいて攻撃をしかけてきました。


逃げようと身をかわしたところ、背後に2台のロボットもいたようでまたもゲームオーバー。


こんな感じで何度もプレイを繰り返した結果、最終的にはすべてのロボットから離れて上の方の足場に飛び移っていくことに成功していました。


なお、3本のサンプルムービーでそれぞれ難易度が違ったように、DeepMind Labは学習させたい内容を高度にカスタマイズすることができるとのこと。カスタマイズはGitHubから行うことができ、GitHubのURLは近日中にDeepMind Labのページで公開される予定です。

この記事のタイトルとURLをコピーする

・関連記事
ついにGoogleの人工知能「AlphaGo」と世界最強の棋士「イ・セドル」が対決へ、しかもYouTubeでライブ中継 - GIGAZINE

囲碁チャンピオンを打ち破ったGoogleの人工知能チーム「DeepMind」が次に挑戦するのはゲーム「スタークラフト2」 - GIGAZINE

Google「DeepMind」の人工知能は赤ん坊のように「触って覚える・判別する」能力を学習したとの発表 - GIGAZINE

ディープラーニングで人間と同じトーン・スピード・抑揚を再現して自然な音声を出力する「WaveNet」をDeepMindが開発 - GIGAZINE

Googleの人工知能専門チームDeepMindがたった数カ月で40%もGoogleデータセンターの冷却システムを効率化することに成功 - GIGAZINE

Googleの人工知能「AlphaGo」を作ったDeepMindがAIの暴走を止める「緊急停止ボタン」の仕組みを開発 - GIGAZINE

Googleの自己学習する人工知能DQNを開発した「ディープマインド」の実態、何が目的なのか? - GIGAZINE

in ソフトウェア,   動画, Posted by darkhorse_log

You can read the machine translated English article here.