ソフトウェア

Google翻訳などの多言語翻訳が可能な「機械翻訳ツール」の仕組みは一体どのようになっているのか?

by Sarah Joy

Google翻訳をはじめとする機械翻訳が普及した現代では、母国語の異なる人とコミュニケーションを取ることが以前よりも簡単になっています。そんな機械翻訳の仕組みをアニメーションで分かりやすく解説したムービーを、教育コンテンツを数多くアップロードしているTED-Edが公開しています。

How computers translate human language - Ioannis Papachimonas - YouTube


SF映画に登場する宇宙人は、地球外生物にもかかわらず、英語など地球上の言語をペラペラ話せます。


これは、宇宙船の乗組員が宇宙人と会話するために、分厚い「宇宙語辞書」を必死にめくって物語を中断するわけにはいかないため……かもしれません。


宇宙人が英語をぺらぺら話す理由付けのために、SF作品にしばしば登場するのが「多言語翻訳機」。持ち運び可能な小さいデバイスで、受話口に向かって話しかけると、どんな言語にでも翻訳できるという代物です。


フィクションの万能翻訳機で有名なもののひとつが、「銀河ヒッチハイク・ガイド」に登場する万能翻訳ができる魚「バベルフィッシュ」。耳の中に入れると、脳波や神経シグナルを変換して相手にテレパシーで伝えてくれる小さな魚です。


現在のところ、宇宙人語まで翻訳可能な機械は実在しませんが、地球上の言語を翻訳する単純な翻訳機能に絞れば、インターネット上に多くのサービスが存在します。


翻訳サービスを使うと、単語や文章を簡単に翻訳でき……


翻訳した文章をさらに別の言語に翻訳することも可能。この翻訳は単純に辞書を参照しているわけではなく、ブラウザの裏側ではとても複雑な処理が行われています。


機械翻訳の仕組みには大きく分けて「ルールベースの翻訳」と「統計に基づく翻訳」の2種類の方法があります。ルールベースの翻訳では、あらゆる言語の辞書が丸ごと入った「単語データベース」を使います。


単語データベースには、名詞の複数形や動詞の過去形などの活用形もすべて登録されています。


そして、各言語ごとの「文法」にもとづいて、入力内容を別の言語に翻訳していくのです。


例えば「子どもたちがマフィンを食べる」という文章を翻訳ソフトに入力すると、プログラムが主語・述語・動詞・目的語などの文構造(syntax)を解析します。


次に語形(Morphology)を解析して、冠詞・名詞の語幹・接尾辞など、意味を持つ最小のパーツにバラバラに分解します。


最後に、単語1つ1つが文中で果たしている役割(semantics)を分析して、翻訳対象の言語に対応する単語と文法に置き換えていきます。


いくつかの言語は文構造が特殊で、例えばラテン語は単語の順番が入れ変わっても文章として意味を成すことができます。


英語の場合、主語と目的語の名詞を入れ替えると、「子どもたちがマフィンを食べる」と「マフィンが子どもを食べる」という、意味が全く異なる文章になってしまいます。


語形に関しても翻訳上の問題があり、例えばスロベニア語は「子ども2人」と「子ども3人以上」で複数形の接尾辞が異なるという、他の言語には見られない特徴があります。


また、ロシア語には冠詞がないため文章を作りやすい一方で、「特定の子どもたちが特定のマフィンを食べている」のか「ある子どもたちが何らかのマフィンを食べている」のかが分からないという、はっきりと意味をとらえづらいという難点があります。


他にも、ルールベースの機械翻訳では、例えば「食べる(eat)」という単語を翻訳する際に、単に「食べている」だけなのか「むさぼるように食べている」のか、を正しく分析しきれないという短所も持っています。


機械翻訳のもう1つの方法である「統計に基づく翻訳」は、人力で翻訳された本や書類のデータベースと、翻訳したい文章を組み合わせて、翻訳を行います。


統計に基づく翻訳はデータベースの豊富さによって翻訳の質が決まり……


翻訳を何回も繰り返せば繰り返すほど、翻訳の精度がアップします。


機械翻訳による翻訳が不完全である理由について、ある研究者は「人間が言語を理解するための特有の脳構造を持っているためではないか」と推測しています。


Google翻訳などの機械翻訳サービスが普及した現代で、「言語を学ぶ」というのは古い方法だと感じるかもしれません。しかし、現段階ではどんな機械翻訳よりも人力で言語を学ぶ方が正確な翻訳が可能だと言えます。多言語を勉強することで「脳力」が鍛えられるという研究結果もあります。


しかし、世界中に存在する何千もの言語をすべて人力で習得することはほぼ不可能で、機械翻訳のさらなる発展が望まれます。もしかすると、人類が宇宙人と遭遇するころには、どんな言語でも自動で翻訳できる手のひらサイズの機械が誕生しているかもしれません。

・関連記事
Google翻訳アプリ新機能「視覚翻訳」「音声リアルタイム翻訳」を使ってみた - GIGAZINE

「Google翻訳」がスマホをかざすだけで文字を自動認識して翻訳する仕組みとは? - GIGAZINE

瞬時に多言語翻訳可能で海外旅行に重宝しそうな「Microsoft Translator」スマートウォッチ版はこんな感じ - GIGAZINE

Skypeがリアルタイム音声翻訳プレビュー版を公開、その仕組みとは? - GIGAZINE

新しい言語の学習が年齢に関係なく脳を構造的に強化することが明らかに - GIGAZINE

多言語を勉強することで「脳力」が鍛えられ、認知症防止にもつながると判明 - GIGAZINE

世界の見方が変わる5つの言語について - GIGAZINE

in ソフトウェア,   動画, Posted by darkhorse_log