メモ

AIでヴォイニッチ手稿の解明に乗り出したコンピューター科学者が登場、アルゴリズムでわかったこととは?


未解読の文字が記され多数の奇妙な絵が書かれている「ヴォイニッチ手稿」は多くの言語学者や歴史家が解読を試みていますが、2018年現在でも謎が多く残された本です。コンピューター科学者であり自然言語処理の専門家が、そんなヴォイニッチ手稿をコンピューターアルゴリズムで解読するという試みを行っています。

Decoding Anagrammed Texts Written in an Unknown Language and Script | Hauer | Transactions of the Association for Computational Linguistics
https://transacl.org/ojs/index.php/tacl/article/view/821

AI used to decipher ancient manuscript - Faculty of Science
https://www.ualberta.ca/science/science-news/2018/january/ai-used-to-decipher-ancient-manuscript

Alberta computer scientist claims clues to deciphering mysterious Voynich manuscript - Edmonton - CBC News
http://www.cbc.ca/news/canada/edmonton/computer-scientist-claims-clues-to-deciphering-mysterious-voynich-manuscript-1.4503571

ヴォイニッチ手稿は1912年に古書収集家によって発見されたもの。数多くの専門家が「これまでに見たことがない」と語る謎の言語で記され、著者は複数人であることや、一体何のために書かれたのかがさっぱりわからないことから「世界一ミステリアスな本」と呼ばれています。

ヴォイニッチ手稿はどのようにして「世界一ミステリアスな本」になったのか? - GIGAZINE


アルバータ大学のコンピューター科学者であり、自然言語処理の専門家であるGreg Kondrak教授は、AI(人工知能)を使ってそのヴォイニッチ手稿の解明に乗り出しました。Kondrak教授は大学院生であるBradley Hauer氏とともに人間の言語の曖昧さをコンピューターで解読するという研究を行っており、ヴォイニッチ手稿がケーススタディーの対象として選ばれたのです。

まず研究者らは、世界人権宣言を380の言語に翻訳したサンプルを使用し、コンピューターが97%の正確性で系統的に言語を識別できるようにしました。最初、研究者らは「ヴォイニッチ手稿はアラビアの言語で書かれているのではないか?」という仮説をたてていましたが、アルゴリズムを走らせた結果、最もヴォイニッチ手稿の言語に近いのはヘブライ語であると結論づけています。

「これは驚くべきことです。ただ『ヘブライ語である』と決めるのは第一段階に過ぎません。次はこれをどう解読するかです」とKondrak教授。

次に、Kondrak教授はヴォイニッチ手稿の記載は単語中の文字をアルファベット順に並べるアナグラム「アルファグラム」を用いて書かれたものだと考えました。そして、Kondrak教授らはこのようなテキストを解読するアルゴルズムを開発して解読を試みたところ、80%以上単語はヘブライ語の辞書にのっていることがわかりました。

「しかし、私たちには、単語を組み合わせることでどんな意味が生まれるのかがわかりませんでした」と語るのはKondrak氏。自分たちの発見が正しいのかどうかを確認するにはヘブライ語学者を探す必要がありましたが、ヘブライ語学者は見つからず、最終的に研究者らはGoogle翻訳を利用しました。

by Kashif John

その結果、ヴォイニッチ手稿の最初の一文は「She made recommendations to the priest, man of the house and me and people(人々や私、そしてその家の男である聖職者に彼女は勧告した)」という、文章としては奇妙なものの、文法的には成立する形で翻訳ができたそうです。ただし、古代ヘブライ語の学者を見つけ出すことができなかったため、まだヴォイニッチ手稿の文章全体には謎が残っているとのこと。ヘブライ語に通じており、同時に歴史学者である人物を研究者らは求めています。

Kondrak氏は「ヴォイニッチ手稿の専門家らがこのような研究に親しみを持ってくれるとは思いません。彼らはコンピューターが自分に置き換わるものだとして恐怖を感じるかもしれないので」と語っていますが、一方で自分たちの研究が専門家らに受け入れられることを望んでいるとのこと。

なお、研究者らは今後、開発したアルゴリズムを他の古代の言語に適用していく予定となっています。

・関連記事
ヴォイニッチ手稿はどのようにして「世界一ミステリアスな本」になったのか? - GIGAZINE

いまだ解読されていない歴史的な10種の暗号 - GIGAZINE

「ヴォイニッチ手稿」を解読する試み、「世界一ミステリアスな本」には本当のところ何が書かれているのか? - GIGAZINE

おばあちゃんが最期に残し20年間も未解決だった謎の暗号がネットの集合知によって爆速で解明へ - GIGAZINE

世界を悩ませているインターネットのミステリー、謎の暗号「Cicada 3301」 - GIGAZINE

in メモ, Posted by logq_fa