ソフトウェア

AIが人間の行動を観察するだけで同じ行動を模倣する技術をNVIDIAが公開


NVIDIAは、AIが「物体を移動させる」などの人間の行動を観察するだけで、行動前後の物体の位置関係からAIが自ら実行計画を立案して、同じ行動を実行することができる技術を公開しました。

[1805.07054] Synthetically Trained Neural Networks for Learning Human-Readable Plans from Real-World Demonstrations
https://arxiv.org/abs/1805.07054

New AI Technique Helps Robots Work Alongside Humans - NVIDIA Developer News CenterNVIDIA Developer News Center
https://news.developer.nvidia.com/new-ai-technique-helps-robots-work-alongside-humans/

NVIDIAが公開した新しいAI技術は以下のムービーで、わかりやすく解説されています。

Research at NVIDIA: Researchers Help Robots Work Alongside Humans - YouTube


「青」「緑」「赤」「黄」のブロックと「赤いおもちゃの自動車」が並べられた机の上で……


人が、ブロックを下から「赤」「黄」「緑」「青」の順に積み上げます。


この後、最初とは異なる位置にブロックをバラバラに配置。


この様子を観察していたAIは、先ほど人が行っていたように「赤」「黄」「緑」「青」の順にブロックを積み上げました。


この技術は、赤で示された4つのニューラルネットワークで実現しています。


1つ目が「オブジェクト検知ネットワーク」。物体の姿勢を知覚して、空間内にある物体の頂点の位置を予測します。


2つ目の「関係推論ネットワーク」は物体の位置関係を推測します。


3つ目が「プログラム生成ネットワーク」で、物体の位置関係を再現するための実行計画を作り……


4つ目の「実行ネットワーク」で、AIが生成した実行計画をロボットに実行するように命じます。


この4つのネットワークの中で、オブジェクト検知ネットワークと、関係推論ネットワークが作り出す情報は、人間でも読める内容で出力されます。


今回のデモの場合は……


AIが認識した5つの物体は「赤のブロック」「黄色のブロック」「緑のブロック」「青のブロック」「赤いおもちゃの車」と認識しています。今回のデモ用に用いられているAIは、「~の上」「~の左」の2つの位置関係を学習しているようです。


次に「緑のブロックの上に黄色のブロック」「赤のブロックの上に青のブロック」を配置するように学習させ……


ブロックをバラバラに配置すると、AIは「赤の上に青を置く」「緑の上に黄色を置く」と計画してブロックの移動を行います。


このとき、AIが推測した物体の位置関係に誤差が生まれることで、「緑のブロックの上に黄色のブロックを置く」などの処理で実行中にエラーが発生することがあります。


通常のプログラムならここで止まってしまいますが、このAIの場合は再度状態をチェックして……


失敗した処理をやり直し、自らエラーを修復することが可能です。


通常AIの学習にはラベル付けされた大量の学習用データを必要とする「教師あり学習」がよく利用されますが、NVIDIAはこの技術の実現にあたりAIの学習に画像データを使用する「教師なし学習」を採用しています。このため、ラベル付きデータを用意するための労力を削減できる利点があるとしています。

NVIDIAによると、AIの学習に今回デモで使用された「ブロック」や「おもちゃの自動車」のような現実の画像は全く使用していないとのことです。実際に「赤いおもちゃの車」を学習には、以下の画像の左上にあるものが使用されています。このため、今回NVIDIAが公開したデモでは、現実世界の情報がほとんどわからないような学習法であっても、実際の物体を把握できることも実証されたことになります。

この記事のタイトルとURLをコピーする

・関連記事
AIを用いてアニメキャラクターの高解像度画像を生成しアニメーションまでつける「PSGAN」をDeNAが発表 - GIGAZINE

NVIDIAの技術カンファレンス「GTC2018」が開幕、8万基超のCUDAコアで構成される小型スパコン「DGX-2」や自動運転車の仮想シミュレーション技術などを発表 - GIGAZINE

NVIDIAのハイエンドGPU「Titan V」は計算結果がその度に異なる気分屋すぎて技術者が悲鳴 - GIGAZINE

人工知能や機械学習を利用しなくても「SQLの使い方」次第で収益アップは可能 - GIGAZINE

人工知能で光学顕微鏡の映像からリアルタイムでガンを検出する技術をGoogleが開発 - GIGAZINE

in ソフトウェア,   動画, Posted by darkhorse_log

You can read the machine translated English article here.