ネットサービス

地球上の知識すべての共有を目指してWikipediaの翻訳ツールにGoogle翻訳が追加される


人類の財産であるすべての「知識」をオンライン上で共有することを目指してWikipediaを運営するWikimedia Foundationが、Wikipediaで使える翻訳機能にGoogle翻訳を追加したと発表しました。最も優れた翻訳精度を持つといわれる翻訳ソフトのGoogle翻訳がWikipediaの編集ツールとして利用可能になることで、レアな言語でも知識が共有されることが期待できそうです。

You can now use Google Translate to translate articles on Wikipedia – Wikimedia Foundation
https://wikimediafoundation.org/2019/01/09/you-can-now-use-google-translate-to-translate-articles-on-wikipedia/

世界では7000を上回る数の言語が使われています。しかし、知識を共有する場である巨大なオンライン百科事典のWikipediaで文書として用いられているのは約300言語にとどまり、全体の4%しかカバーできていない状態だとのこと。例えば、4億2000万人の話者を抱えるアラビア語でさえ、インターネットコンテンツ全体の3%でしか利用できない状態であり、1200万人以上の話者がいるズールー語では、ごく一部のコンテンツしかインターネット上に公開されていないのが現状だそうです。

by Pernilla Rydmark

世界中のすべての人に無料で知識を提供することを目標とするWikimediaは、言語で隔てられた壁を取り去る努力を続けており、その中で翻訳ツールが重要な役割を持っています。Wikipediaの記事編集者は「コンテンツ翻訳ツール」を利用することができ、編集者が記事をまず最初に全体を大雑把に内容を把握する編集前のたたき台として利用されています。

コンテンツ翻訳ツールではApertiumなど複数の翻訳ツールのサポートによって106の言語がサポートされていましたが、新たにGoogle翻訳が追加されることになりました。Google翻訳の追加によって、ハウサ語クルド語ヨルバ語、ズールー語など15言語が追加サポートされるとのこと。なお、Google翻訳はGoogleによって無償提供され、Google翻訳ツールを利用して編集されたWikipediaの記事も他の記事と同様の扱いを受けます。


Google翻訳ツールの追加に関してWikipediaは「Content translation/Machine Translation/Google Translate」という、よくある質問に答えたページを公開しています。

Content translation/Machine Translation/Google Translate - MediaWiki
https://www.mediawiki.org/wiki/Content_translation/Machine_Translation/Google_Translate

これによるとGoogle翻訳ツールを利用した編集者の個人情報がGoogleに収集されることはないとのこと。Googleによる情報収集に対する懸念に対応するために、WikimediaはGoogle翻訳の利用契約をいつでも破棄することが可能であり、契約期間も1年間で契約終了時に再評価されると述べています。

・関連記事
Google翻訳の対応言語が100カ国を突破、オンライン人口の99パーセントをカバーに - GIGAZINE

Wikipediaがイギリスで最も古いタブロイド紙「Daily Mail」を「信頼できない情報源」にする - GIGAZINE

Google翻訳のAIは独自の「中間言語」を習得して「学習してない言語間の翻訳」すら可能な段階に突入 - GIGAZINE

逆翻訳を利用してAIをバイリンガルにする新しい翻訳技術が開発中 - GIGAZINE

Wikipedia創設者ジミー・ウェールズがフェイクニュースと戦う「Wikitribune」を立ち上げる - GIGAZINE

AIに常識を叩き込むために「Wikipediaを読ませる」と研究者 - GIGAZINE

in ソフトウェア,   ネットサービス, Posted by logv_to