サイエンス

テキストの指示だけでタスクを実行可能な上に別のAIにスキルを教えることができるAIが開発される


人間とその他の動物を分ける認知機能のひとつに、人間は「口頭や書面での指示に従って、さまざまなタスクを実行できる」というものが挙げられます。新たにスイス・ジュネーヴ大学の研究チームが、テキストによる指示のみに基づいてタスクを学習して実行可能であり、「姉妹AI」に学習内容を教えることもできるAIを開発しました。

Natural language instructions induce compositional generalization in networks of neurons | Nature Neuroscience
https://www.nature.com/articles/s41593-024-01607-5


Two artificial intelligences talk to each other - Medias - UNIGE
https://www.unige.ch/medias/en/2024/deux-intelligences-artificielles-se-mettent-dialoguer

Scientists create AI models that can talk to each other and pass on skills with limited human input | Live Science
https://www.livescience.com/technology/artificial-intelligence/scientists-create-ai-models-that-can-talk-to-each-other-and-pass-on-skills-with-limited-human-input

事前のトレーニングを受けることなく、口頭または書面による指示のみに基づいて新しいタスクを実行することは、人間に備わった独自の能力です。また、人間は自分が学習したタスクを、言葉を使って別の人間に教えることもできます。

ジュネーヴ大学の神経科学者であるアレクサンドル・プージェ氏らの研究チームは、人間が持つこれらの能力を持つAIの開発に取り組みました。プージェ氏は、「現在、AIを使った会話型エージェントは、言語情報を統合してテキストや画像を生成することができます。しかし、私たちが知る限りでは、AIチャットボットは口頭または書面による指示を感覚運動に変換することはできず、それを別のAIに説明して再現させることもできません」と述べています。


プージェ氏らの研究チームは、人間の言語を理解するように事前訓練された「Sentence-BERT(SBert)」という自然言語処理モデルを、感覚入力の解釈とそれに対する動作のシミュレーションを行う小規模なニューラルネットワークに接続したとのこと。この「sensorimotor-recurrent neural network(RNN:感覚運動再帰型ニューラルネットワーク)」は、50の心理物理学的タスクのセットでトレーニングされ、刺激に反応するようになっていました。

研究チームが開発したRNNは、組み込み言語モデルのSBertによりテキストを完全に理解できました。RNNは、それまでトレーニング映像を見たりタスクを実行したりした経験がないにもかかわらず、自然言語による指示だけで「刺激が与えられた方向を指す」「コントラストに差がある2つの視覚的刺激のうち明るい方を指す」といったタスクを、平均83%の精度で実行できたと報告されています。

さらにRNNは、自らが学習したスキル内容を言語的な指示を使って同一の「姉妹AI」に伝達することもできました。プージェ氏は、「これらのタスクを学習すると、ネットワークは2番目のネットワーク(1番目のネットワークのコピー)に説明し、タスクを再現させることができました。私たちの知る限り、2つのAIが純粋に言語的な方法で会話できたのはこれが初めてです」とコメントしました。


今回の研究結果は、機械同士の対話を可能にする技術開発が課題となっているロボティクス分野に有望な影響を及ぼすとのこと。研究チームは、「私たちが開発したネットワークはとても小さなものです。これを基盤としてより複雑なネットワークを開発し、互いに理解し合えるヒューマノイドロボットに統合することを妨げるものはありません」と述べました。

この記事のタイトルとURLをコピーする

・関連記事
既存のAIモデルを組み合わせて超高性能モデルを作る手法を日本のAI企業「Sakana AI」が開発、進化的アルゴリズムで膨大な組み合わせを試行し人間には発想困難な高性能LLMや画像生成モデルを作成可能 - GIGAZINE

AIを操る「プロンプトエンジニア」がAIによって駆逐されつつある - GIGAZINE

画像生成AIで「文字の出力」が難しいのは「外国人の謎漢字タトゥー」と似た原因という指摘 - GIGAZINE

AIで職を失う危機が迫る中で「過去に本当に滅んだ職業」を確認してみた - GIGAZINE

国連がAIに関する初の世界決議を全会一致で採択、個人情報の保護・AIのリスク監視など - GIGAZINE

Microsoftが「AIに関する特別イベント」を2024年5月に開催、Surface Pro 10やAI Explorerの詳細も明らかになるか - GIGAZINE

OpenAIの次世代大規模言語モデル「GPT-5」が2024年夏に公開されるとの報道 - GIGAZINE

in ソフトウェア,   サイエンス, Posted by log1h_ik

You can read the machine translated English article here.