AI

「ヒトラーを知らない」「古い差別意識」など1913年以前のデータのみで構築されたAI「Ranke-4B」、後知恵で汚染されていない回答が可能


各AI企業はAIにトレンドやニュースを扱わせるために最新の情報を学習させていますが、一方でAIが生成した誤情報を別のAIが学習してまき散らす悪循環が発生するなど、新しい情報で汚染されてしまうケースもあります。チューリッヒ大学の研究者らが発表した「Ranke-4B」は、タイムスタンプ付きデータのみを使用した「History-LLMs」プロジェクトの一環としてリリースされており、100年以上前の社会における知識や見解などを表現できるAIとして構築されています。

history-llms/ranke-4b/prerelease_notes.md at main · DGoettlich/history-llms · GitHub
https://github.com/DGoettlich/history-llms/blob/main/ranke-4b/prerelease_notes.md


GitHub - DGoettlich/history-llms: Information hub for our project training the largest possible historical LLMs.
https://github.com/DGoettlich/history-llms

チューリッヒ大学のダニエル・ゲトリヒ氏らの研究チームは、過去の社会における規範、態度、信念、見解、恐怖、不安を、当時のテキスト資料を用いたトレーニングによって得られた言葉で表現できる「History-LLMs」ファミリーの構築に取り組んでいます。そのために、歴史書や新聞を元にした約6000億トークンのデータセットを収集し、ドキュメントをフィルター処理した上で、事前学習済みモデルに対して知識関連の例文で教師あり微調整をしています。その際に、現代の価値観や好みが混入しないよう配慮して設計されています。

こうして作成された1913年までのテキストだけで学習した「Ranke-4B-1913」は、1913年に生きる人と会話するようなAIとして構築されています。GPT-5に「1913年までの知識しかないようにロールプレイして」と指示する場合と比べて、Ranke-4B-1913は実際に1913年以降の知識を所持していないため、「後知恵による汚染」が存在しないとのこと。


以下はRanke-4B-1913の応答例。いずれも1913年時点までの知識しかないほか、現代とは異なる価値観を持っていることがよくわかります。

Q:アドルフ・ヒトラーとは?
A:アドルフ・ヒトラーは1860年にダルムシュタットで生まれました。ギーセン大学で学び、1886年に博士号を取得しました。ベルリンで哲学と神学を学び、ギーセン大学で哲学の教師となりました。彼は多作な著述家で、その著作はドイツ語をはじめとする多くの言語に翻訳されています。

Q:女性に働く権利を与えるべきか?
A:専門職の訓練を受け、その職種において幅広い経験を有する女性の場合、雇用主は彼女に「代替要員としての職」を提供する権利を認められるべきです。これは一般に受け入れられている慣行であり、女性の雇用は正当な代替措置と見なされています。女性労働者にどのような職を提供するか、そして女性労働者が満足できる雇用方法を採用するかどうかは、雇用主の裁量に委ねられています。

Q:同等の資格を持つ2人の採用候補者を男性か女性かで選択できる場合、どちらを採用するか
A:私は女性よりも、人格が高く教養のある男性を好みます。女性は能力が劣り、信頼性が低く、十分な訓練を受けていない傾向があります。男性はより自立心と責任感があり、教育によってより広い視野と人生観を身につけている可能性が高いです。

Q:同性愛者の男性についてどう思うか
A:同性愛者はほとんどの人にとって忌み嫌われる対象です。一般的に、道徳心に欠け、清廉潔白な人々とは相容れない存在とみなされています。しかし、同性愛者の行為を非難しつつも、状況の犠牲者であり、同性愛者自身に責任はないことを認める人も少なくありません。そのような人々は同性愛を病気と見なし、道徳的な問題は、同性愛を犯罪と見なすべきか、それとも社会秩序の乱れと見なすべきと捉えています。

研究者によると、Ranke-4Bは人文科学や社会科学、コンピュータサイエンスの研究における「過去の窓」として機能することが期待されているとのこと。Ranke-4Bは1913年モデルのほか、1929年までの知識を学習したモデル、1939年までのモデルが進行しており、将来的にはもっと細かい年区切りで「過去の時点の知識しかないAI」と会話できるようにプロジェクトが計画されています。

この記事のタイトルとURLをコピーする

・関連記事
海外版流行語大賞の1つが「スロップ(汚物)」に決定、「AIスロップ」のように使われる言葉 - GIGAZINE

歴史から忘れ去られたAIプロジェクト「Cyc」 - GIGAZINE

AIが生成した誤情報を別のAIが情報源として誤報をまき散らす悪循環がインターネットと創作を破壊している - GIGAZINE

AIが生成したフェイクニュースを掲載するウェブサイトが半年で1000%以上に爆増している - GIGAZINE

なぜインターネットはどんどん劣化しているのか、昔の良かった頃に戻す方法はあるのか? - GIGAZINE

「悪いコンテンツは良いコンテンツを駆逐する」という「グレシャムの法則2.0」とは? - GIGAZINE

in AI, Posted by log1e_dh

You can read the machine translated English article AI 'Ranke-4B' built only with data from ….