2020年07月03日 13時15分 ネットサービス

「言語に依存しないウィキペディア」で言語の壁を乗り越えるプロジェクト「Abstract Wikipedia」が開始

by Noj Han



オンライン百科事典のウィキペディアを運営・管理するウィキメディア財団が、新しいプロジェクト「Abstract Wikipedia」が理事会の全会一致で承認されたと発表しました。このプロジェクトが進められることで、ウィキペディアの情報をより多くの言語で共有できるようになるとのことです。



Abstract Wikipedia/2020年7月発表 - Meta

https://meta.wikimedia.org/wiki/Abstract_ウィキペディア/July_2020_announcement/ja



「Abstract Wikipedia」は、2020年5月にウィキペディアの共同設立者の1人であるDenny Vrandečić氏によって提案されたプロジェクトで、ウィキメディア財団にとって7年ぶりとなる大型プロジェクトです。Abstract Wikipediaの目標は「より多くの人がより多くの知識をより多くの言語で共有できるようにすること」であり、具体的には「Wikidataを拡張してウィキペディアに適用することで、言語に依存しない方法でウィキペディアの記事を作成あるいは管理する」ことを目指します。



ウィキペディアの記事を開くと、左カラムに英語版やドイツ語版、韓国語版など、最大171言語版のページへのリンクが掲載されています。この各言語版ページは、ウィキペディアプロジェクトに参加する有志によって作成あるいは翻訳されたものとなっています。しかし、ウィキペディアは「百科事典」という性質上、言語に大きく依存してしまうため、ある言語版で得られる情報が別の言語版では得られないという問題が生じます。また、翻訳であったとしても、正しく翻訳されるとは限らないという問題もあります。





2016年に開始したウィキデータは、ウィキメディア財団が提供する共同編集型のデータベースです。開始当初から「言語間リンクの一元化」がコンセプトとなっているウィキデータでは、基本的に「パラメータに対して値を与える」という形で情報が記述され、各項目はIDによって一意に識別されます。





たとえば、以下は17世紀の音楽家であるヨハン・ゼバスティアン・バッハのページ。「Q1339」というIDが与えられており、英語や日本語など複数の言語でこのページを共有することとなります。





バッハのウィキデータページを見ると、たとえばdate of death(亡くなった日)、place of death(亡くなった場所)、manner of death(死亡状況)、cause of death(死因)、place of burial(埋葬場所)という項目にそれぞれ値が設定されています。つまり、「ヨハン・ゼバスティアン・バッハは1750年7月28日にライプツィヒで、脳卒中によって病死し、聖トーマス教会に葬られた」という情報を言語固有の文法を使わずに表現しているわけです。「St. Thomas Church」をクリックすると……





聖トーマス教会のウィキデータページにジャンプしました。St. Thomas Churchという名前の横に「Q170402」というIDが振られています。





このウィキデータで使われている方法でウィキペディア記事の基礎となる部分を記述することで、ウィキペディアを言語非依存モデルにし、どの言語にも普遍的な価値を持つ記事モデルを作れると期待できます。ウィキメディア財団のキャサリン・マー理事長は、「ボランティアは、この抽象的な「記事」をプログラムを使って自分の言語に翻訳できます。うまくいけば、誰もが Wikidata を使って書かれた記事を自分の言語で読めるようになるでしょう」と述べています。



ただし、Abstract Wikipediaを進めるためには多くの協力とソフトウエア開発が必要になります。マー理事長は、Abstract Wikipediaがあくまでも実験的なプロジェクトであり、ウィキペディアのコミュニティにそれぞれの需要があることを認めた上で、「この新プロジェクトが知識へのより広範なアクセスをもたらし、知識の公平性を推し進めることができるかもしれないと私達は興奮しています。またこのプロジェクトは、知識はどのように、そして誰に構築されるのかについての重大な問いをもたらします。これらの問いについて、コミュニティと一緒に熟考することを楽しみにしています」と語りました。