サイエンス

ロボットのトレーニングを大規模言語モデルで加速する技術「DrEureka」をNVIDIAなどの研究チームが開発


ロボットに新しいスキルを習得させる場合、まずシミュレーション環境でトレーニングを行い、それから現実環境に展開するのが一般的ですが、その際にシミュレーション環境と現実環境のギャップが課題になります。このギャップを埋める作業を大規模言語モデルで自動化する技術「DrEureka」を、NVIDIAやペンシルベニア大学、テキサス大学オースティン校などの研究チームが開発しました。

DrEureka | Language Model Guided Sim-To-Real Transfer
https://eureka-research.github.io/dr-eureka/


Nvidia’s DrEureka outperforms humans in training robotics systems | VentureBeat
https://venturebeat.com/automation/nvidias-dreureka-outperforms-humans-in-training-robotics-systems/

ロボットに習得させたいスキルをシミュレーション環境でトレーニングしてから現実環境に展開するアプローチでは、タスクに対する正しいアクションを見つける「報酬関数」とシミュレーション環境の物理パラメータを、手動で設計および調整するのが一般的です。このプロセスでは時間や人的コストがかかるため、研究チームは大規模言語モデルを使用してこの作業を自動化する技術を開発することにしました。


研究チームがシステムの土台にしたのは、NVIDIA Researchが開発したAIエージェントの「Eureka」です。Eurekaはロボットをトレーニングするための報酬アルゴリズムを自律的に作成するAIエージェントで、大規模言語モデルを使用して最適な報酬関数を作成できるとのこと。

今回研究チームは、Eurekaのシミュレーション環境の物理パラメータをランダム化することで、ロボットが現実世界で遭遇する予測不可能な状況にシミュレーション環境での学習を一般化できるようにした「DrEureka(ドメインランダム化Eureka)」を発表しました。

DrEurekaを用いてロボット犬に四足歩行のスキルをトレーニングした実験では、人間が設計した従来のシステムよりも前進速度で34%、さまざまな地形での移動距離で20%優れていることが確認されました。また、ロボットハンドでルービックキューブを回転させるタスクでは、DrEurekaによるトレーニングを行った方が人間の設計したトレーニングよりも300%多くキューブを回転させられたとのことです。


さらに研究チームは、四足歩行のロボット犬に「ヨガボールの上でバランスを取って歩く」というタスクをDrEurekaで学習させる実験も行いました。実際にDrEurekaのトレーニングを受けたロボット犬が、ヨガボールの上でバランスを取って歩く様子は以下の動画で確認できます。

DrEureka 5-minute Uncut Deployment Video - YouTube


画面の左端から、ヨガボールに乗ったまま小刻みに揺れるロボット犬が現れました。


ロボット犬の手綱は人間が持っており、その動きに合わせてロボット犬はヨガボールに乗ったまま移動しています。


地形が変わっても落ちることなく、ヨガボールの上でバランスを取り続けられます。


また、以下の動画ではDrEurekaでトレーニングしたロボット犬が、空気が抜けてだんだんしぼんでいくヨガボールの上で器用にバランスを取り続ける様子を見ることが可能です。

DrEureka Balancing on a Deflating Ball - YouTube


なお、DrEurekaのコードはGitHubでオープンソースとして公開されています。

GitHub - eureka-research/DrEureka
https://github.com/eureka-research/DrEureka

この記事のタイトルとURLをコピーする

・関連記事
「人型ロボットがコーヒーを入れる動画」がAIロボティクスの未来にとって大きな一歩を示す理由とは? - GIGAZINE

OpenAI支援のロボット企業「1X」のアンドロイドが洗練された動作でタスクをこなすムービー、ちょっと不気味ながら未来を感じさせまくる光景 - GIGAZINE

たった3万7000円で自作できるオープンソースのロボットアーム - GIGAZINE

世界第2位の雇用者であるAmazonが75万台のロボットで10万人の人間を置換、「AIによる労働の変化の縮図」との指摘 - GIGAZINE

Google DeepMindから「自己改善型AI」が登場、あらゆる場面でのロボットアームの使い方を勝手に身につけることが可能 - GIGAZINE

ロボットに仮想空間で「現実世界とは何か」を学ばせることで学習を高速化する「Habitat 2.0」をFacebookが発表 - GIGAZINE

Googleのロボット工学チームが「ロボット工学三原則」にインスピレーションを得た「ロボット憲法」を作成 - GIGAZINE

ボストン・ダイナミクスの人型ロボットに自我が芽生えるパロディムービー第2弾が登場、軍事訓練を受けるも大暴走してしまう - GIGAZINE

in ソフトウェア,   ハードウェア,   サイエンス,   動画, Posted by log1h_ik

You can read the machine translated English article here.