ロボットハンドに何千年分もの「経験」をシミュレーションの中でさせて片手でルービックキューブを解けるようにする試み
片手でルービックキューブを解くことができるロボットハンドを、人工知能を研究する非営利組織のOpenAIが開発しています。この技術はアルゴリズムに頼り切るのではなく、多数のシミュレーション環境を作り出すことで、「人間が進化から手の動きを発達させたように、ロボットハンドに何千年分もの経験をさせる」という点がポイントとのこと。研究者は「この技術は私たちの考え方を変えた」と研究者は述べています。
Solving Rubik’s Cube with a Robot Hand
https://openai.com/blog/solving-rubiks-cube/
ルービックキューブを解くOpenAIのロボットハンドがいかに画期的なのかは、以下のムービーを見るとよくわかります。
Solving Rubik’s Cube - YouTube
「私たちは、人間のようにトライ&エラーから学ぶことができるロボットを作ろうとしました」
「そのために私たちが行ったのは、ルービックキューブを片手で解くことができるアルゴリズムの訓練でした」
人間ですら、片手でルービックキューブを解くのは難しいもの。
ロボットは「ルービックキューブの解き方」を教えられたのではなく、指の摩擦や、キューブの面を変えることの容易さ、重力、キューブの重さといった情報から、自分で解き方を学んだとのこと。
ロボットの世界において、ロボットハンドがこのように複雑な技術を習得することは、これまでできませんでした。
人間は手で物を操作できるように長い時間と学習をへて進化しました。人間と同じようにロボットハンドが動くには、これと同様のことをゼロから行う必要があります。
言い換えると、専門に特化したアルゴリズムを作ることでは人間と同様のことを行えないということ。そこで研究チームは何千というシミュレーション環境を作り、それぞれの環境でタスクを実行できるようになれば、人間の世界でもロボットハンドが活躍可能だと考えました。
これはつまり、シミュレーション環境の中でロボットハンドのネットワークに何千年分もの経験をさせるということを意味します。
研究チームは、「ロボットハンドが与えたタスクを学習し上達してくると、新たなタスクを課す」という行為を繰り返しました。
これは、現実世界ではより困難な環境にロボットが置かれる可能性があるためです。以下の画像では、ロボットハンドがゴム製の手袋をはめられることで、タスクが困難になっています。それでもロボットハンドはルービックキューブを落とすことなく、面をそろえています。
「新しい環境に対してロボットを適応させる」という部分が、今回開発された技術の核となる知能だと研究チームは考えています。
紙吹雪をかけられても……
ゴムひもをかけられてもロボットハンドはルービックキューブを解くことに成功しています。
「この技術は、一般目的のロボットの訓練について、私たちの考え方を変えました」「アルゴリズムばかりについて考えるのではなく、彼らが学習できる『複雑な環境』をどのように作るのかについて考えるようになりました」
「これはより想像力を必要とすることです」「私たちの目標は、ロボットが多くのさまざまなタスクをこなせるようになること。そして、生活の標準を上げ、よりよい生活を多くの人に提供することです」と研究チームは述べています。
OpenAIがこのような技術を開発し始めたのは2017年5月のこと。人間にすら難しいこの技術をロボットが学習するためには多くの時間を要するため、2019年時点で成功率は60%ほど。ルービックキューブの複雑さを最大にすると成功率は20%とのことで、引き続き研究が行われています。
・関連記事
ルービックキューブをそろえる完全レゴブロック製の自作ロボットが話題に - GIGAZINE
世界最速、わずか1秒でルービックキューブを解くマシンの解説ムービー - GIGAZINE
世界最速の0.38秒でルービックキューブを解くマシンが登場、世界記録を大幅に塗り替える様子がムービーで公開中 - GIGAZINE
ルービックキューブが勝手に動いて自分で色をそろえてくれる「全自動ルービックキューブ」のすさまじいムービーが公開中 - GIGAZINE
ルービックキューブを一瞬で解くことに深層強化学習アルゴリズムが成功 - GIGAZINE
「ルービックキューブが解ける」高機能なロボットハンド駆動システムの開発が進んでいる - GIGAZINE
・関連コンテンツ