ネットサービス

Google翻訳をはじめとした翻訳ツールは用語誤解の原因になりうる


Chromeで開いている母語以外のページを翻訳してくれる機能は便利なものですが、その翻訳が正確かどうかは、しっかり調べなければわからない部分があります。カーネギーメロン大学のVinay Prabhu博士らは、翻訳の結果、女性が男性になってしまったり、「暴力を禁じる」が「暴力を命ずる」のように、正反対の内容になってしまう事例があると指摘しています。

Google translate bias investigations - YouTube


Prabhu博士らが発表したのは「Did they direct the violence or admonish it? A cautionary tale on contronomy, androcentrism and back-translation foibles(彼らは暴力を指示したのか、いさめたのか?コントロノミー、男性中心主義、逆翻訳についての注意点)」という論文。という論文。

(1/n) Our paper "Did they direct the violence or admonish it? A cautionary tale on contronomy, androcentrism and back-translation foibles" will be presented #AfricaNLP workshop today ????@eaclmeeting @GradioML Notebook: https://t.co/0aytQSwBOh
????️ https://t.co/k9G5Jlfelw pic.twitter.com/ABBoKT18uY

— Vinay Prabhu (@vinayprabhu)


最初に博士らが着目したのは、男性主義的なバイアスを示す「彼女(she)生存率」です。これは、いったん翻訳した文章を元の言語で翻訳し直す「逆翻訳」を行ったとき、「彼女(she)」という語が残るかを示す数値。

(2/n) In this initial work, we focus on two facets of shortcomings of #GoogleTranslate
The first, is the androcentrist default-to-male bias measured via "She survival rate" of languages: The odds that the pronoun 'She' will survive a backtranslation journey to a language pic.twitter.com/PiEpdsFtLk

— Vinay Prabhu (@vinayprabhu)



アフリカの言語で行ったところ、ニジェール・コンゴ語族では「彼女生存率」は極めて低く、アフロ・アジア語族ではかなり高いという、大きな差が出ました。これは「言語に性差が出やすいかどうか」に根付いたものだと考えられます。

(3/n) In the African context, we observed a Niger-Congo v/s Afro-asiatic schism develop that has roots in the way the languages are gender-loaded ( Cue Guiora Scale / Word atlas of languages chapters 30-32) pic.twitter.com/bTsE5yVjwk

— Vinay Prabhu (@vinayprabhu)



次に博士らが着目したのは、対義語の誤訳です。調査は全109言語を対象として、縦断的に行われました。

(4/n) The second facet we explore is the downstream effects of mistranslating contronyms (Janus word / enantiosemy). Firstly, we did a longitudinal study across all the 109 languages
Idea credits: @abidlabs https://t.co/2fXoo7o0MD pic.twitter.com/KwIy6quhyt

— Vinay Prabhu (@vinayprabhu)


さらに、弱い部分を明らかにするため、単一の言語でさらに多くの対義語の横断調査も行ったとのこと。

(5/n) And then, proceeded to also perform latitudinal exploration across many contronymous phrases across a single language to uncover more frailties. pic.twitter.com/6793oV7dcx

— Vinay Prabhu (@vinayprabhu)



実際に、ヒンディー語を用いた逆翻訳で、作家・医師として活躍した女性、ラッシード・ジャハーン氏が男性であったかのような変換になることが示されています。

(6/n) This paper took me through many a beautiful by-lane of psycholinguistics (The Shapir-whorfian linguistic relativity debates!) and introduced me to the works of Dr.Rashid Jahan ( Credits: @iawoolford ) and Yoruba linguists such as @aremuadeolajr pic.twitter.com/iQWZQE6Fhn

— Vinay Prabhu (@vinayprabhu)



論文の完全版はまもなく公開予定だとのことです。

(7/7) The final version of the paper will be out soon. Mighty kudos and heartfelt thanks to the organizers of #AfricaNLP2021 and @alienelf for tolerating sharing the wrong talk video :P
/ Fin

— Vinay Prabhu (@vinayprabhu)


この記事のタイトルとURLをコピーする

・関連記事
Googleが「知らない言語」も翻訳処理ができてしまう言語モデル「LaBSE」を発表 - GIGAZINE

機械翻訳は海外貿易にどのような影響を与えているのか? - GIGAZINE

めちゃくちゃ精度が高いと話題の機械翻訳「DeepL翻訳」に日本語の翻訳機能が登場したので実際に使ってみた - GIGAZINE

無料でウェブページの文章を翻訳してくれる&発音も教えてくれるアドオン「Mate Translate」を使ってみた - GIGAZINE

機械翻訳はWikipediaの翻訳ツールとしていまだに問題があり、Wikipedia自体の信頼性を低下させている - GIGAZINE

in ネットサービス,   動画, Posted by logc_nt

You can read the machine translated English article here.