サイエンス

心理学実験で人間の反応を予測する基盤モデル「Centaur」が登場、160の研究で得られた1000万件以上の人間の選択がベースに


ドイツやアメリカの国際的研究チームが、任意の実験における人間の行動を予測・シミュレートする基盤モデル「Centaur」を発表しました。Metaのオープンソース大規模言語モデル「Llama 3.1 70B」をベースに開発されたCentaurは、160の心理学実験から得られた1000万件もの人間の選択を含むデータセットで訓練されており、実験のストーリーや構造が改変された場合や、まったく新しい領域の実験にも一般化できるとのことです。

A foundation model to predict and capture human cognition | Nature
https://www.nature.com/articles/s41586-025-09215-4


Excited to see our Centaur project out in @nature.com.
TL;DR: Centaur is a computational model that predicts and simulates human behavior for any experiment described in natural language.

[image or embed]

— Marcel Binz (@marcelbinz.bsky.social) 2025年7月3日 0:34


Centaur
https://marcelbinz.github.io/centaur

Scientists Use A.I. to Mimic the Mind, Warts and All
https://www.nytimes.com/2025/07/02/science/ai-psychology-mind.html

すでに現代のAIは、かつて人間のみが可能だったさまざまなことを実現しています。たとえばチェスや囲碁のチャンピオンに勝利したり、車を運転したり、タンパク質の立体構造を予測したり、まるで人間のように自然な会話や文章を生み出したりすることがAIには可能です。


しかし、記事作成時点のAIの多くは特定の領域のみに特化しており、人間とは大きく異なる存在です。チェスのチャンピオンは自分で車を運転して会場まで行くことができますが、チェスが得意なAIは車を運転できません。また、AIチャットボットは人間とスムーズな会話をすることができますが、チェスをプレイさせるとコマの動かし方を間違えるなど、非常に初歩的で奇妙なミスを犯すことがあるそうです。

こうした欠点はありますが、一部の科学者らはAIが人間の心を理解する上で役に立つと期待しています。ドイツの医学系研究センターであるHelmholtz Munichの認知神経科学者であるマルセル・ビンツ氏らの研究チームは、新たに科学誌のNatureに掲載された論文で、自然言語で表現可能なあらゆる実験において人間の行動を予測・シミュレートする基盤モデルのCentaurを発表しました。


CentaurはMetaのLlama 3.1 70Bをベースとしており、合計6万人以上の被験者が参加した160件の心理学実験の結果からなるデータセット「Psych-101」を用いて訓練されています。Psych-101に含まれる実験は「宇宙船を操縦して宝物を探すゲームをプレイする実験」「単語のリストを暗記する実験」「配当が異なる2台のスロットマシンをプレイしてできるだけ多くの報酬を得る実験」などさまざまで、人間の被験者が選んだ1000万件以上の選択が含まれています。

研究チームはLlama 3.1 70Bに各実験の被験者を演じるように指示し、AIが人間のような反応を示した場合に報酬を与えて訓練を行いました。ビンツ氏は、「私たちは基本的に、人間の被験者が行った選択を模倣するようにロボットへ教えたのです」と語っています。

訓練の後にCentaurがどれほどうまく機能するのかテストしたところ、Centaurはデータセットに含まれていない実験でも、被験者がどのように反応したのかを正確に予測しました。また、「宇宙船を操縦して宝物を探す」といったゲームを改変して「空飛ぶじゅうたんを操縦して宝物を探す」といった内容にしてプレイさせてみると、人間の被験者と同じようにCentaurも宇宙船で編み出した戦略を空飛ぶ絨毯にも適用したとのことです。

Centaurは、データセットに含まれていなかった論理的推論に関する質問に対しても、人間が正解した質問には正しく答え、人間が難しいと感じた質問にはうまく答えられないという傾向を示しました。ビンツ氏は、「ここではCentaurの反応にかなりの一般化が起こっています」と述べました。


Centaurの開発に関与していないスタンフォード大学の認知科学者であるラス・ポルドラック氏は、「Centaurは実に素晴らしいものです。これは人間とまったく同じようにあらゆる種類のタスクを実行できる初めてのモデルです」と高く評価しました。

ビンツ氏は、「最終的には人間の心を全体として理解し、これらすべてがどのようにつながっているのかを解明したいと考えています」と述べました。研究チームは心理学実験のデータベースを5倍に増やす作業を進めており、Centaurのさらなるトレーニングを計画しているとのことです。

Centaurは以下のHugging Faceページからダウンロードすることができます。

marcelbinz/Llama-3.1-Centaur-70B-adapter · Hugging Face
https://huggingface.co/marcelbinz/Llama-3.1-Centaur-70B-adapter

この記事のタイトルとURLをコピーする

・関連記事
「古いAIモデルは軽度認知機能障害の兆候を示した」という論文がメディアに取り上げられて困惑の声が上がる - GIGAZINE

処理するトークンが増えすぎるとAI言語モデルが動作困難になる理由、計算コストは​​入力サイズの2乗に比例 - GIGAZINE

AIは人間よりも感情をより良く理解している可能性、専門家からは「うのみにするべきではない」との意見も - GIGAZINE

「AIに頼り過ぎるといつの間にか自身のアイデンティティが作り変えられてしまう」と倫理学者が警告 - GIGAZINE

AIの知能評価テストには人間にとって重要な「質問をする能力」の評価項目がないという指摘 - GIGAZINE

「AIが人間と同レベルの知性を獲得する日は来るのか?」という質問に5人の専門家が回答 - GIGAZINE

学生がChatGPTを使いすぎると成績とモチベーションが低下するとの研究結果 - GIGAZINE

in ソフトウェア,   ネットサービス,   サイエンス, Posted by log1h_ik

You can read the machine translated English article A basic model 'Centaur' that predicts hu….