Google翻訳をはじめとした翻訳ツールは用語誤解の原因になりうる
![](https://i.gzn.jp/img/2021/04/20/translate-botch/00.png)
Chromeで開いている母語以外のページを翻訳してくれる機能は便利なものですが、その翻訳が正確かどうかは、しっかり調べなければわからない部分があります。カーネギーメロン大学のVinay Prabhu博士らは、翻訳の結果、女性が男性になってしまったり、「暴力を禁じる」が「暴力を命ずる」のように、正反対の内容になってしまう事例があると指摘しています。
Google translate bias investigations - YouTube
![](https://img.youtube.com/vi/eKRpiMBlu40/maxresdefault.jpg)
Prabhu博士らが発表したのは「Did they direct the violence or admonish it? A cautionary tale on contronomy, androcentrism and back-translation foibles(彼らは暴力を指示したのか、いさめたのか?コントロノミー、男性中心主義、逆翻訳についての注意点)」という論文。という論文。
(1/n) Our paper "Did they direct the violence or admonish it? A cautionary tale on contronomy, androcentrism and back-translation foibles" will be presented #AfricaNLP workshop today ????@eaclmeeting @GradioML Notebook: https://t.co/0aytQSwBOh
— Vinay Prabhu (@vinayprabhu) April 19, 2021
????️ https://t.co/k9G5Jlfelw pic.twitter.com/ABBoKT18uY
最初に博士らが着目したのは、男性主義的なバイアスを示す「彼女(she)生存率」です。これは、いったん翻訳した文章を元の言語で翻訳し直す「逆翻訳」を行ったとき、「彼女(she)」という語が残るかを示す数値。
(2/n) In this initial work, we focus on two facets of shortcomings of #GoogleTranslate
— Vinay Prabhu (@vinayprabhu) April 19, 2021
The first, is the androcentrist default-to-male bias measured via "She survival rate" of languages: The odds that the pronoun 'She' will survive a backtranslation journey to a language pic.twitter.com/PiEpdsFtLk
アフリカの言語で行ったところ、ニジェール・コンゴ語族では「彼女生存率」は極めて低く、アフロ・アジア語族ではかなり高いという、大きな差が出ました。これは「言語に性差が出やすいかどうか」に根付いたものだと考えられます。
(3/n) In the African context, we observed a Niger-Congo v/s Afro-asiatic schism develop that has roots in the way the languages are gender-loaded ( Cue Guiora Scale / Word atlas of languages chapters 30-32) pic.twitter.com/bTsE5yVjwk
— Vinay Prabhu (@vinayprabhu) April 19, 2021
次に博士らが着目したのは、対義語の誤訳です。調査は全109言語を対象として、縦断的に行われました。
(4/n) The second facet we explore is the downstream effects of mistranslating contronyms (Janus word / enantiosemy). Firstly, we did a longitudinal study across all the 109 languages
— Vinay Prabhu (@vinayprabhu) April 19, 2021
Idea credits: @abidlabs https://t.co/2fXoo7o0MD pic.twitter.com/KwIy6quhyt
さらに、弱い部分を明らかにするため、単一の言語でさらに多くの対義語の横断調査も行ったとのこと。
(5/n) And then, proceeded to also perform latitudinal exploration across many contronymous phrases across a single language to uncover more frailties. pic.twitter.com/6793oV7dcx
— Vinay Prabhu (@vinayprabhu) April 19, 2021
実際に、ヒンディー語を用いた逆翻訳で、作家・医師として活躍した女性、ラッシード・ジャハーン氏が男性であったかのような変換になることが示されています。
(6/n) This paper took me through many a beautiful by-lane of psycholinguistics (The Shapir-whorfian linguistic relativity debates!) and introduced me to the works of Dr.Rashid Jahan ( Credits: @iawoolford ) and Yoruba linguists such as @aremuadeolajr pic.twitter.com/iQWZQE6Fhn
— Vinay Prabhu (@vinayprabhu) April 19, 2021
論文の完全版はまもなく公開予定だとのことです。
(7/7) The final version of the paper will be out soon. Mighty kudos and heartfelt thanks to the organizers of #AfricaNLP2021 and @alienelf for tolerating sharing the wrong talk video :P
— Vinay Prabhu (@vinayprabhu) April 19, 2021
/ Fin
・関連記事
Googleが「知らない言語」も翻訳処理ができてしまう言語モデル「LaBSE」を発表 - GIGAZINE
機械翻訳は海外貿易にどのような影響を与えているのか? - GIGAZINE
めちゃくちゃ精度が高いと話題の機械翻訳「DeepL翻訳」に日本語の翻訳機能が登場したので実際に使ってみた - GIGAZINE
無料でウェブページの文章を翻訳してくれる&発音も教えてくれるアドオン「Mate Translate」を使ってみた - GIGAZINE
機械翻訳はWikipediaの翻訳ツールとしていまだに問題があり、Wikipedia自体の信頼性を低下させている - GIGAZINE
・関連コンテンツ
in ネットサービス, 動画, Posted by logc_nt
You can read the machine translated English article Translation tools such as Google Transla….