ソフトウェア

Google アシスタントが収集した会話がGoogleの下請け従業員に聞かれている


Googleが開発したAIアシスタントの「Google アシスタント」は、スマートスピーカーである「Google Home」に搭載されているほか、スマートフォンアプリとしても利用されています。そんなGoogle アシスタントが多くのユーザーの会話を録音し、Googleの下請け従業員が人々のプライベートに関わる会話を聞いていたことがわかりました。

Google employees are eavesdropping, even in Flemish living rooms, VRT NWS has discovered | Flanders News
https://www.vrt.be/vrtnws/en/2019/07/10/google-employees-are-eavesdropping-even-in-flemish-living-rooms/

2019年4月、Amazonの音声認識アシスタントであるAmazon Alexaが会話内容を録音し、従業員が音声データを解析していることが判明し、大きな話題を呼びました。ベルギーの放送局・VRTによると、Googleでもこれと同じようなことをしているそうです。

VRTではAmazonの一件の後にGoogleの下請けとして働いている人物と接触。オランダ国内で収集された音声データを解析するため、ホラントフランドルで12人ほどが働いているという証言を得ました。

by Burst

Googleが収集している音声データは、Google Homeなどを経由して、人々がGoogle アシスタントに話しかけたもの。VRTは取材の中で、プライベートな会話や個人情報に関わるような内容も含めて、1000件以上の音声を聞いたとのこと。

音声データに登場した住所やその他の情報は、組み合わせると特定の人物にたどり着くことが可能な状態となっていて、VRTでは実際に当事者への取材を実施。フランドル在住の男性は、VRTの入手した音声データを聞いて「これは間違いなく私の声です」と証言したほか、ワーアスムンステルに住む夫婦は子どもや孫の声が聞こえると証言したそうです。


Googleがユーザーから収集した音声データを集めて解析しているのは、オランダ語の微妙な発音をGoogle アシスタントに理解させるためだとのこと。自己学習アルゴリズムやGoogleのツールだけで音声コマンドを認識するのが困難な場合も多いため、解析には人間の手が必要というわけ。下請け従業員らはGoogleが自動で生成した音声のスクリプトに対し、間違っている点がないかどうかに二重チェックを行っているそうです。VRTによると、Google Homeによって収集された音声は非常に明瞭であり、スマートフォンアプリ版のGoogle アシスタントで録音されたものは電話音質だった模様。

音声データとユーザー情報自体は切り離されているのですが、音声内容そのものに個人情報につながる情報が含まれていれば、VRTが音声データの発話者を特定したのと同様に個人の特定は可能です。また、スクリプトのチェックには単語のつづりを知っていなければなりませんが、会社名や名前、地名といった固有名詞はつづりがわかりにくく、Google検索やFacebookでつづりを確かめた結果、音声データの持ち主と思われる人物を発見してしまうこともあるそうです。

by Startup Stock Photos

VRTが聞いた1000を超える音声のうち、153件は「OK、Google」というコマンドが明確に発話されておらず、本来であれば録音されるべきではなかったとのこと。しかし、近くにいた誰かが偶然にも「OK、Google」に聞こえてしまう言葉を発した結果、Google Homeが録音を開始してしまった可能性があるとVRTは指摘しています。

偶然に録音されてしまった音声には、寝室でのプライベートな会話や専門家による機密性の高い情報を含めた会話が含まれている可能性もあり、プライバシーの問題が考えられます。また、VRTの情報源となった下請け従業員は、個人のプライバシーに関わる多くの医学的問題をGoogle Homeで検索する人々の音声や、ポルノを検索する男性の音声などを聞いてしまうケースがあったと証言しています。VRTでは、こうした音声の録音は利用規約にも書かれていると認めつつも、この条項が表立って話題になる機会がないため、「会話がGoogleに記録・保存されている」と自覚している人が少ないと指摘しています。

なお、Googleは音声データ利用に関するVRTの問い合わせに対して、世界中の音声専門家と協力して音声技術を向上させていると説明し、ベルギーのGoogle広報担当者は「この作業はGoogle アシスタントのような製品を支えるテクノロジーの開発にとって非常に重要です」と回答。また、分析対象となる音声データは全体のわずか0.2%ほどであり、いかなる個人情報あるいは個人を識別可能な情報とも結びついていないと述べたとのことです。

by Aaron Yoo

この記事のタイトルとURLをコピーする

・関連記事
3大AIアシスタントのSiri・Alexa・Googleアシスタントに「私のことスパイしてる?」と聞いたらこうなった - GIGAZINE

Alexaが聞いた会話内容は録音されAmazonの従業員によって解析されている - GIGAZINE

Amazon Echoが盗聴していた会話をアドレス登録した相手に送り付けるという驚愕の事件が発生 - GIGAZINE

「Google Home Mini」に周囲の音声を常時録音しGoogleへと送信する不具合が見つかる - GIGAZINE

Facebookが「盗聴しているのでは?」と思える精度でユーザーの行動を追跡できるのはなぜなのか? - GIGAZINE

T2チップを搭載するMacBookは「史上最強」のマイク盗聴防止機構を備えることが判明 - GIGAZINE

Googleの7インチディスプレイ搭載型スマートスピーカー「Google Home Hub」の画像がリークされる - GIGAZINE

日本発売が決定したGoogleの対話型AI「Google Assistant」搭載スピーカー型端末「Google Home」の新機能まとめ - GIGAZINE

in ソフトウェア, Posted by log1h_ik

You can read the machine translated English article here.