衣類を洗濯機から取り出して畳んだり食事後のテーブルを片付けたりできる汎用ロボット基盤モデル「π0」
チェスで人間を打ち負かしたり、新薬を創出したりと、AIは難しい課題で人間を超えるような才能を見せることがある一方で、人間なら容易にこなせるタスクに苦戦することがあります。このことは、機械工学研究者のハンス・モラベックによる「モラベックのパラドックス」として知られているのですが、物理的な課題の解決にも取り組んでいかなければならないということで、基盤モデルと学習アルゴリズムの開発を手がけるグループのPhisycal Intelligenceが、8カ月かけて、汎用的な動きを実現するロボットに対応するためのAIモデルとして、汎用ロボット基盤モデルの「π0」を開発しました。
Our First Generalist Policy
https://www.physicalintelligence.company/blog/pi0
Physical Intelligenceによると、「π0」は「人工物理知能(Artificial Physical Intelligence)」開発という長期的目標の最初のステップだとのことで、大規模言語モデル(LLM)やチャットボットアシスタントを使うときと同じように、ロボットに任意のタスクを解決するよう依頼することができます。
「π0」は多様なデータを学習しているので、さまざまな指示を実行することができます。LLMとは異なり画像やテキストだけではなく、ロボットの具体的な体験にも基づいたトレーニングから、新たなアーキテクチャを介して直接的な運動のコマンドを出力することを学び、「物理的知性」を獲得しています。
デモンストレーション映像として、「π0」が洗濯物を洗濯機から取り出して畳んだり、食事が終わった後のテーブルを片付けたり、箱を組み立てたりするタスクをこなす様子が公開されています。
ロボットアームでドラム型洗濯機のフタを開けて洗濯物を取り出す様子
洗濯機から取り出した洗濯物を次々と畳んでいく様子
食事が終わった後に残された食器を片付ける様子
コーヒー豆を計量してミルに移していく様子
箱を組み立てる様子
プロトタイプの第1号モデルは、オープンソースのデータセットおよび8つの異なるロボットから集めた器用な作業のデータセットでトレーニングが行われました。トレーニング元として、特化した作業ではなく幅広い作業が含まれるデータが用いられた理由は、特定用途を解決するのではなく、物理的な相互作用の一般的な知識を基盤モデルに学習させるためで、「物理的知性の最初の基盤」とPhysical Intelligenceは表現しています。
モデル構築を成功させるために、Physical Intelligenceはロボットコミュニティ全体を巻き込んでの共同作業が必要だと考えていると述べており、すでに多くの企業や研究所との協力を始めていることを明かしています。
・関連記事
MetaがAI向けの触覚センサーを開発中、センサーメーカー「GelSight」とロボット企業「Wonik Robotics」と提携 - GIGAZINE
ロボットアームで福島第一原発の原子炉からどうやって核燃料デブリを取り出すのか - GIGAZINE
AmazonがAIロボティクス企業・Covariantの創業者とスタッフ25%を雇用しロボット基盤モデルの非独占ライセンス契約を締結 - GIGAZINE
NVIDIAが「日本の量子コンピューター研究を支援」「人型ロボット基盤モデルを強化」「創薬向けAIサービス」「自動車向けAIチップの提供拡大」などをGTC 2024で発表 - GIGAZINE
ボストン・ダイナミクスなどロボット企業6社が「自社ロボットを武器化しない」と誓約、武器化はロボットへの信頼を損なうと主張 - GIGAZINE
・関連コンテンツ