世界一の収録単語数をほこる辞書「オックスフォード英語辞典」はどうやって時代の変化を生き残ってきたのか?
オックスフォード英語辞典(OED)は、多様な英語の用法と60万語以上の語句を収録している言語辞典です。無料でも単語の意味がわかるサービスWikipediaやGoogleなどの競合サービスがある中、OEDはこれまで時代の波をどのように乗り越え、将来の戦略を取っていくのかをイギリスのメディアThe Guardianが伝えています。
Inside the OED: can the world’s biggest dictionary survive the internet? | News | The Guardian
https://www.theguardian.com/news/2018/feb/23/oxford-english-dictionary-can-worlds-biggest-dictionary-survive-internet
OEDはオンライン公開されており、毎年新しく7000語もの語句が収録されます。また、新オックスフォード米語辞典(OAD)の場合はさらに追加する語句が増え、2008年からはこれらの辞書でTwitterのつぶやきからも語句の収集も行われています。記者が辞書編集者に「全ての言葉を集めるんですか?」と尋ねると、「『文字通り』です」という返答が帰って来たとのこと。
OEDの先祖は1755年に出版された英語辞書、通称「Johnson’s Dictionary(ジョンソンの辞書)」です。4万3500の語句を収録しており当時に使用されいた言語の80パーセントを収録していたと言われています。この辞書は1712年に辞書の作成計画がスタート。1747年に完成するまで編集が続き、計画から完成までに43年と膨大な時間を費やしたことから、「英雄的な愚行」と言われています。
By Alex Brown
英語の辞書編集には長い間、問題が立ちふさがっていました。それは、英語は16世紀まで古代アングロサクソン語やゲルマン語、ノルウェー語、ラテン語、ギリシャ語など多数の言語が入りっていた言語だからです。加えて、植民地の言語も交じり、つづりや発音がバラバラで辞書の編集ができるような状態ではありませんでした。例えば英語の単語には、アラビア語とラテン語が語源の「alcohol(アルコール)」やフランス語が語源の「abandonment(放棄)」などが存在しています。
1604年に、ロバート・コードリーという名の聖職者が初めての英語の辞書、つまり「英英辞典」である「A Table Alphabeticall」を作ります。しかし、この辞書は語句の説明に乏しく、収録語句が少ないものでした。収録語句は500語と、当時使われていた単語の5パーセントと言われています。その後にも数々の辞書が生まれましたがどれも収録語は数千語と収録語句が乏しいものでした。
以下の画像がコードリー氏が編集した辞書です。
1664年にイギリスの王立協会は、英語に包括的な辞書が存在しないことを問題視します。これはフランス語とイタリア語、そしてスペイン語には包括的な辞書が存在し、英語には存在しなかったという現状の「気恥ずかしさ」からでした。その後1712年に英語の辞書を作る計画が持ち上がります。
この辞書編集の計画は「偉大で厄介な仕事のポスト」として難航し、編集を率いるトップのポストに出版社団体により作家のサミュエル・ジョンソンが任命されるまで失敗が続きます。その難航理由は「英語は急速に進化する生き物のような言語」というもの。ジョンソン氏はこの辞書編集という行為に対して「不可能というだけでなく笑ってしまうような行為」という感想をもっていたとのこと。
OEDは遠く離れたジョンソンの辞典の子孫です。現在第3版まで出版されており、全改訂も経験した大規模なプロジェクトです。そして、現在の辞書は、内容をデジタル化し改訂を続けています。このデジタル化は2000年に完了する予定でしたがアップデートが続いています。このデジタル版の収録語句は現代人が使う「48.7パーセント」とオックスフォード出版部門のマイケル・プロフィット氏が答えています。
1928年にそれまで150年の間に定番だったジョンソンの辞書に替わる辞書が誕生します。オックスフォード大学出版局のジェームズ・マレー氏の元に2000人の編集ボランティアが募り「New English Dictionary」(NED:新英語辞書)が完成します。後に、この辞書の名前が変わり、現在の「オックスフォード英語辞典」(OED)になります。NEDは全10巻で収録語句は約41万4800語句が収録されていました。
しかし、この辞書の編集には長い時間がかかってしまいました。1884年に「A」の語句が収録された1冊目が出版され始めましたが、最後の10冊目が出版されたのは1928年のこと。つまり、アルファベットのAからZまでの間で収集された語句の年が44年の時間差があり、「A」から「L」に収録されている語句が古く、1933に補正する事になります。
マレー氏とスタッフたちは、以下の画像の場所で辞典の初版を編集してを行っていました。
その後、1960年代末に「コーパス言語学」というコンピューターを使った辞書編集のアプローチが始まります。恋愛小説や本からコンピューターで「実際に使われている語句」を集めるというものです。2017年にイギリスのバーミンガムで行われたコーパスの言語学のカンファレンスではTwitterユーザーが使う「笑い」を意味する「LOL」と「ROFL」などの語句を研究者が収集し話し合っていたとのこと。
他の辞書の出版社はコーパス言語学を導入しましたが、OEDは導入せず現状の方法に固執していました。1989年3月にOEDの第二版が出版され、29万1500語の語句が収録されていました。しかし、「新しい版ではなく古いものとの混ぜ合わせ」という非難を浴びました。例えば、「コンピューター」という言葉は「計算機」と定義されており、これは1897年に収集されていたものがそのまま残されていました。同年1989年にオックスフォード出版部門の執行役員がコーパス言語学の導入を言及します。
現代のOEDの辞書編集者は、デジタル化によりさらに深い語句の探索が可能になりました。しかし、その方法が裏目に出るときもあります。例えば、コーパス言語の解析により語句が示された場合には語句の背景を確認する作業を行うのですが、その際には17世紀の手描きの文字までさかのぼって確認しなければいけない場合もあります。
辞書を最新に保つための作業は悲惨な大きさに拡大します。新語を追加することで、新しい言葉に対応できるようになりますが、同時にそれはこれまで以上に多くの語句が表示され、より速く突然変異が起きるようになり、作業が指数関数的に増加するようになりました。 OED辞書編集者の一人は「それは果てがありません。ワームホールに落ちているように感じることあります」とコメントします。
By Annie C
オックスフォード出版部門のマイク・ランデル氏は、オーストラリア固有の言語の辞書編集のプロジェクトに人材補強として参加する人物です。ランデル氏は「辞書を作ることは、工芸品と同じくらい芸術的です。辞書は大きな変化を作り出すことができます。固有の言語を話し、辞書を持たない彼らに言葉の『保存』と『共有』を助けることができます。過去には影響をあたえることはできないかもしれませんが、彼らに言語の力を与えることができます」とプロジェクトについて興奮を語りました。
デジタル化したOEDは毎日、少しだけより完全になろうとしています。辞書チームは日々変化するこの辞書を「動く文書」と呼びます。単語が追加され、それらは決して削除されません。OEDは年に4回オンラインアップデートを行っています。更新が予定通りに実際に2037年までに行われた場合、OEDが誕生してから完成までに49年に達します。この歳月は、ジョンソンの辞書に費やされた43年を上回るものとなり、最初に収録された語句は初出から49年が経過することになります。収録語句は古くなり、時代に合わせるために再び全改訂する必要が生まれます。このように辞書の作成は果てしなく続いていきます。
・関連記事
2週間に1冊のペースで本を書いた巨匠アイザック・アシモフによる書き続けるための6つのこと - GIGAZINE
本を開くことなく中身を読む技術をMITが開発 - GIGAZINE
本から限られた時間で最大限の情報を得る読書のコツをまとめた「本の読み方」 - GIGAZINE
ビル・ゲイツが「ここ10年で読んだ最高の一冊」を発表、選ばれた「永遠のお気に入り」とは? - GIGAZINE
近畿大学が提供を開始した「人工知能でSNSから潜在的ニーズに合った本を紹介するコンテンツ」を使うとこんな感じ - GIGAZINE
・関連コンテンツ