ネットサービス

機械翻訳はWikipediaの翻訳ツールとしていまだに問題があり、Wikipedia自体の信頼性を低下させている


人類の財産である「知識」をオンライン上で共有することを目標とするWikipediaは、英語版とその他の版で記事の量と質に格差が存在しています。「機械翻訳」はその格差を埋めてくれると期待されていますが、現在のところ良い結果は得られていないどころか、「機械翻訳が問題となってWikipedia自体の信頼性が下がっている」とThe Vergeが報じています。

Wikipedia has a Google Translate problem - The Verge
https://www.theverge.com/2019/5/8/18526739/wikipedia-translation-tool-machine-learning-ai-english

Wikipediaは世界中で知識を自由に利用できるようにすることを目標にしていますが、英語版の記事は550万件である一方、100万件以上の記事があるのは302言語のうち15言語しかありません。「ヒト」という記事のある言語は187言語、「幸福」という記事がある言語に至っては99言語しかありません。

このような言語間の格差を取り除くため、2019年1月にWikipediaを運営するウィキメディア財団は、Wikipediaで使える翻訳機能にGoogle翻訳を追加しました。

地球上の知識すべての共有を目指してWikipediaの翻訳ツールにGoogle翻訳が追加される - GIGAZINE


Wikipediaにログインして、上部のタブから「ベータ版」をクリックして、「コンテンツ翻訳」にチェックを入れるとGoogle機械翻訳による翻訳記事の作成機能がオンになります。「コンテンツ翻訳」を活用すると、別の言語から機械翻訳をベースにしてWikipediaの記事を作成できます。


Google翻訳以前にもWikipediaに対応した機械翻訳はありましたが、Google翻訳は翻訳精度が優れていると期待されていました。しかし、Google翻訳ですら機械翻訳としては不十分で、結果としてさまざまな問題や議論が巻き起こりました。

AIに関するニュースを掲載する「Skynet Today」は「AIは人間より優れた翻訳ができるのか?いいや、AIは人間の相手にすらならない!」という見出しの記事で、機械学習による翻訳の原理や問題点について解説しています。記事によると、AIは「アメリカのオバマ大統領」と一度学習してしまった場合、「アメリカのトランプ大統領」という学習になかなか上書きできないといった問題点や、音楽について書かれている文章で「メタル」という単語を「金属」と翻訳するなど、人間ならば「常識」から翻訳できる単語をAIは判断できないといった問題点などが挙げられています。

Has AI surpassed humans at translation? Not even close! Skynet Today


The Vergeによると、「AIの翻訳は人間の翻訳と同レベルになっている」というニュースがあっても、それはあくまでも限定的なテストでの結果に限られるとのこと。Wikipediaのある管理者によると、英語版では「村のポンプ」と書かれた箇所が、機械翻訳されたポルトガル語版では「村を爆撃」と表記されてたそうです。また別の管理者はこの問題について、「Google翻訳を完璧だと考えている人もいますが、明白に間違っています。機械翻訳は言語を知ることに替わるものではありません」とコメントしています。

また、Wikipediaにおける機械翻訳導入の問題点として、機械翻訳を活用する翻訳者の間でも「翻訳能力に差がある」ということが挙げられています。機械翻訳を活用して記事を作成する場合、意味の通った記事を作成するためには翻訳者が1つ1つ文章をチェックする必要があります。しかし、ポルトガル語版Wikipediaの管理者であるギリエルメ・モランディーニ氏は「ユーザーが機械翻訳で訳された記事をそのまま投稿することはよくあることです」と語っており、そうやって作成された機械翻訳任せの記事の信頼性は「悲惨」とのことです。

By Besjunior

機械翻訳任せのずさんな翻訳記事が多数投稿された結果、Wikipedia自体の信頼性が低下しているようです。モランディーニ氏は「ポルトガル語版Wikipediaを利用するブラジルにおいては、Wikipediaは信頼に値しないと見なされています」と語っています。他にも、インドネシアのWikipediaコミュニティはウィキメディア財団がWikipediaから自動翻訳機能を削除することを正式に要求していますが、ウィキメディア財団は今のところ要求に応じていないようです。

The Vergeがインタビューしたユーザーのほとんどは手動翻訳と機械翻訳を組み合わせた手法をとっていて、「特定の単語の意味を調べるときだけ機械翻訳を使用する」と回答しているとのこと。また、インタビューしたユーザーの全員が「機械翻訳は人間の文章を理解できないため、Wikipediaの記事する翻訳する有用な手法にはなり得ないだろう」ということに同意しているそうです。

By halfpoint

The Vergeは一連の問題について、「英語版以外のWikipediaに記事を投稿する編集者にとって、機械翻訳は『祝福』というよりも『呪い』である」と表現しています。

この記事のタイトルとURLをコピーする

・関連記事
AIに常識を叩き込むために「Wikipediaを読ませる」と研究者 - GIGAZINE

MicrosoftのAI翻訳は中→英ニュース翻訳を人間の翻訳者と同じ精度でこなせるレベルに到達 - GIGAZINE

Facebookが機械翻訳の質を劇的に向上させるAI技術を開発 - GIGAZINE

GoogleのAI部門でトップだったエンジニアが示す機械学習システムアーキテクチャの進むべき姿とは? - GIGAZINE

Wikipediaで自分の記事を削除された人が実体験をもとに語る「削除されないようにするための有効な方法」 - GIGAZINE

in ソフトウェア,   ネットサービス, Posted by darkhorse_log

You can read the machine translated English article here.