2024年03月25日 12時00分サイエンス

テキストの指示だけでタスクを実行可能な上に別のAIにスキルを教えることができるAIが開発される

人間とその他の動物を分ける認知機能のひとつに、人間は「口頭や書面での指示に従って、さまざまなタスクを実行できる」というものが挙げられます。新たにスイス・ジュネーヴ大学の研究チームが、テキストによる指示のみに基づいてタスクを学習して実行可能であり、「姉妹AI」に学習内容を教えることもできるAIを開発しました。

Natural language instructions induce compositional generalization in networks of neurons | Nature Neuroscience
https://www.nature.com/articles/s41593-024-01607-5

Two artificial intelligences talk to each other - Medias - UNIGE
https://www.unige.ch/medias/en/2024/deux-intelligences-artificielles-se-mettent-dialoguer

Scientists create AI models that can talk to each other and pass on skills with limited human input | Live Science
https://www.livescience.com/technology/artificial-intelligence/scientists-create-ai-models-that-can-talk-to-each-other-and-pass-on-skills-with-limited-human-input

事前のトレーニングを受けることなく、口頭または書面による指示のみに基づいて新しいタスクを実行することは、人間に備わった独自の能力です。また、人間は自分が学習したタスクを、言葉を使って別の人間に教えることもできます。

ジュネーヴ大学の神経科学者であるアレクサンドル・プージェ氏らの研究チームは、人間が持つこれらの能力を持つAIの開発に取り組みました。プージェ氏は、「現在、AIを使った会話型エージェントは、言語情報を統合してテキストや画像を生成することができます。しかし、私たちが知る限りでは、AIチャットボットは口頭または書面による指示を感覚運動に変換することはできず、それを別のAIに説明して再現させることもできません」と述べています。

プージェ氏らの研究チームは、人間の言語を理解するように事前訓練された「Sentence-BERT(SBert)」という自然言語処理モデルを、感覚入力の解釈とそれに対する動作のシミュレーションを行う小規模なニューラルネットワークに接続したとのこと。この「sensorimotor-recurrent neural network(RNN：感覚運動再帰型ニューラルネットワーク)」は、50の心理物理学的タスクのセットでトレーニングされ、刺激に反応するようになっていました。

研究チームが開発したRNNは、組み込み言語モデルのSBertによりテキストを完全に理解できました。RNNは、それまでトレーニング映像を見たりタスクを実行したりした経験がないにもかかわらず、自然言語による指示だけで「刺激が与えられた方向を指す」「コントラストに差がある2つの視覚的刺激のうち明るい方を指す」といったタスクを、平均83％の精度で実行できたと報告されています。

さらにRNNは、自らが学習したスキル内容を言語的な指示を使って同一の「姉妹AI」に伝達することもできました。プージェ氏は、「これらのタスクを学習すると、ネットワークは2番目のネットワーク(1番目のネットワークのコピー)に説明し、タスクを再現させることができました。私たちの知る限り、2つのAIが純粋に言語的な方法で会話できたのはこれが初めてです」とコメントしました。

今回の研究結果は、機械同士の対話を可能にする技術開発が課題となっているロボティクス分野に有望な影響を及ぼすとのこと。研究チームは、「私たちが開発したネットワークはとても小さなものです。これを基盤としてより複雑なネットワークを開発し、互いに理解し合えるヒューマノイドロボットに統合することを妨げるものはありません」と述べました。

この記事のタイトルとURLをコピーする

・関連コンテンツ

2024年03月25日 12時00分00秒 in ソフトウェア, サイエンス, Posted by log1h_ik

You can read the machine translated English article An AI that can perform tasks with just t….