Google「DeepMind」の人工知能は赤ん坊のように「触って覚える・判別する」能力を学習したとの発表
By Warren R.M. Stuart
目の前にある物体の重さや壊れやすさなどの性質を知るためには、人間であればまず「触ってみる」「つかんでみる」という行動を経てどのようなものかを把握するもので、特に好奇心の強い子どもだと「口に入れてみる」といった行動を取ることもあります。そんな、人間のような「触ってみる」という行動を通じて目の前の物体の特徴を把握することにGoogle DeepMindの人工知能(AI)が成功したことが発表されます。
(PDF)1611.01843v1.pdf
Google DeepMind’s AI learns to play with physical objects | New Scientist
https://www.newscientist.com/article/2112455-google-deepminds-ai-learns-to-play-with-physical-objects/?
Google teaches DeepMind AI how to interact with real objects; squish puny humans
https://www.neowin.net/news/google-teaches-deepmind-ai-how-to-interact-with-real-objects-squish-puny-humans
Googleやカリフォルニア大学バークレー校らによる研究チームが今後発表予定で、査読が行われている論文によると、Google DeepMindでは実在する物体の重さを把握することができるAIロボットの開発に成功したとのこと。これはいわば、人間が物体の性質を把握するために取る行動をロボットができるようになったことを意味しており、ロボットが人間の能力を超える「シンギュラリティ(技術的特異点)」にたどり着くためのステップをまた1つ登ったといえる出来事です。
研究では、同じ大きさで重さの異なる5つのブロックをAIロボットの前に1列に置き、ロボットにどれが最も重いかを当てさせる学習を繰り返します。正しいものを選んだときにはプログラム的な報酬が与えられ、間違ったものを選んだ場合にはネガティブフィードバックが与えられて次回以降の動作が改善されます。これらをもとに、AIロボットは報酬をよく得ることができる方法をいろいろとトライします。
最初はいわば「適当」にブロックを選んでいたというAIロボットですが、学習を繰り返すうちに「全てのブロックを持ってみて、一番重いものを選ぶ」ということだけが正解にたどり着く唯一の方法であることを学んだとのこと。
次にロボットに与えられた課題でも、最大で5個のブロックを用いて同様に最も重いものを選ばせますが、今回はブロックの配置を1列ではなく、タワー状に積み上げるように変更されています。ロボットはまず、そこに何個のブロックがあるのかを把握するよう努め、最終的には同じように全てのブロックをつかんでから正解を見つけるように行動したとのこと。その中でロボットは、「タワーを引っ張ることで積み上げられたブロックをバラバラにする」という行為を覚えたそうです。
今回のように報酬とネガティブフィードバックをもとにAIロボットが機械学習を行うことは強化学習と呼ばれ、DeepMindが2014年に発表した「人間よりもゲームが上達したAI」の学習にも用いられていたものです。
ゲームを自ら学んで人間以上に上達できる人工知能「DQN」が人間を脅かす日はいつくるのか? - GIGAZINE
強化学習を行うことで、AIは人間や動物のように特別な指示がなくても解決方法を見いだすことができるようになるとのこと。シェフィールド大学のEleni Vasilaki教授は「この能力により、既知の問題に対処するための新しい巧妙な方法や、人間が指示を与えない状態でも解決策を見いだすことができるようになるでしょう」と語っています。
この能力も、シンギュラリティに向けた技術進歩の中ではほんのわずかな一歩であるとのことですが、今後、ロボットとAIが現実の世界の中で行動する際に大きな1つの足がかりになるものであると言えそうです。
・関連記事
Googleの人工知能専門チームDeepMindがたった数カ月で40%もGoogleデータセンターの冷却システムを効率化することに成功 - GIGAZINE
Googleの自己学習する人工知能DQNを開発した「ディープマインド」の実態、何が目的なのか? - GIGAZINE
Googleの人工知能開発をリードするDeepMindの天才デミス・ハサビス氏とはどんな人物なのか? - GIGAZINE
・関連コンテンツ