ソフトウェア

AIは古文書を読むのが得意、古文書の写真を見せるだけで内容の読み取りが可能&専門家でも気付きにくい細かなポイントにも対応可能


AIはすさまじい勢いで発展しており、AIを研究分野で用いる動きも活発化しています。カリフォルニア大学サンタクルーズ校で歴史を研究しているベンジャミン・ブリーン氏は、OpenAI製AIの古文書解読能力の高さを絶賛しています。

The leading AI models are now good historians
https://resobscura.substack.com/p/the-leading-ai-models-are-now-very

AIを用いて古文書を解読する試みは数年前から実施されてきましたが、従来の手法ではAIに関する専門知識が必要でした。しかし、ChatGPTなどのチャットAIの登場によってAIに詳しくない人でもAIの情報処理能力の恩恵を受けられるようになりました。2023年には「あらかじめ文字起こしした古文書」の内容をGPT-4やClaude 2に認識させられることも確かめられています。

GPT-4とClaude 2は「16世紀に書かれたラテン語の魔術書」まで翻訳することが可能、学者が「人間のプロに匹敵する」と太鼓判 - GIGAZINE


その後登場したGPT-4oやOpenAI-o1といったAIモデルでは、画像の読み取り性能も大きく向上しました。そこで、ブリーン氏は「古文書の写真」をそのままGPT-4oに読み込ませて、内容を書き起こすように指示しました。その結果、16世紀のイタリアで書かれた古文書を書き起こすことに成功。書き起こされたテキストは、いくつかの小さな間違いを含んでいたものの、研究に活用できる品質だったそうです。


さらに、18世紀のメキシコで書かれた医学書の画像をOpenAI-o1に読み込ませた結果、内容の書き起こしに成功しただけでなく「言語や内容から書物の目的を分析する」「挿絵から筆者の強調したい内容を分析する」といった高度なタスクもこなすことができました。


また、OpenAI-o1はページ内の人物のイラストについて「胸にハートのメダリオンを掲げた17世紀~18世紀のスペイン人紳士」と読み取りました。ブリーン氏によると、人物が実際に手に持っているのは医療機器の収納箱と尿瓶(しびん)と推測されるとのこと。ブリーン氏は「OpenAI-o1の推測は間違っていますが、このような細かい部分にまで気付いて分析をはじめたことは特筆に値する」とコメントしています。


なお、ブリーン氏は古文書の読み取りに役立つGPTs(カスタムGPT)を公開しています。

ChatGPT - The Historian's Friend
https://chatgpt.com/g/g-u5cMhl7RY-the-historian-s-friend

この記事のタイトルとURLをコピーする

・関連記事
DeepMindの碑文解読AI「Ithaca」で失われた碑文を72%の精度で復元することに成功 - GIGAZINE

GoogleのAIは古代ギリシャの碑文解読をものの数秒で行うことができるように - GIGAZINE

GPT-4とClaude 2は「16世紀に書かれたラテン語の魔術書」まで翻訳することが可能、学者が「人間のプロに匹敵する」と太鼓判 - GIGAZINE

「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目 - GIGAZINE

in ソフトウェア, Posted by log1o_hf

You can read the machine translated English article AI is good at reading ancient documents,….