セキュリティ

無料で使えるAIが生成した声で銀行口座への侵入に成功したとの報告


アメリカやヨーロッパなどの銀行では、口座にログインするためのセキュアなアクセス方法として、電話口での声紋認証が採用されています。ニュースサイト・Motherboardのライターであるジョセフ・コックス氏が、無料で使える音声AIを使って自分の銀行口座にアクセスできたことを報告しました。

How I Broke Into a Bank Account With an AI-Generated Voice
https://www.vice.com/en/article/dy7axa/how-i-broke-into-a-bank-account-with-an-ai-generated-voice

以下の動画を再生すると、実際にAIの合成音声で銀行にアクセスしている場面を見ることができます。

Lloyds Bank logged into using AI voice - YouTube


コックス氏が銀行に電話をかけると、「Lloyds Bankにようこそ」との自動音声が流れました。Lloyds Bankはイングランドとウェールズに店舗を持つリテールバンクで、同地域における大手4行である「ビッグフォー」の一角を占める銀行です。


まず、銀行の自動音声は電話の理由を尋ねました。これに対し、コックス氏は自分で答える代わりに音声ファイルをクリックします。すると、AIによって出力された「残高をチェックしたい」との音声が再生されました。


これに対し、銀行の自動音声は「オーケー」と反応。コックス氏は続いて、キーパッドで生年月日を入力します。


次に、自動音声が「『私の声は私のパスワードです』と言ってください」と要請すると、コックス氏は再びAIが生成した音声を再生しました。


数秒すると、自動音声は「ありがとうございます。残高は次の通りです」と述べて、口座残高の案内を始めました。コックス氏は、このやり取りで最近の取引や送金先のリストなど、あらゆる口座情報にアクセスすることができたと報告しています。


コックス氏はこの音声の作成に、ElevenLabsというサービスを使いました。ElevenLabsは無料で使用可能ながら精度の高いAI音声を作成できるので、インターネット上ではすでにさまざまな嫌がらせに使われているとのこと。今回のテストで使用されたのも、コックス氏のイギリスなまりのアクセントを最もよく再現できたからでした。

こうした合成音声は、詐欺やハッキングに悪用できる可能性もあるため、危険であると警鐘を鳴らしている専門家もいます。ソーシャルエンジニアリングを専門とする企業であるSocialProof SecurityでCEOを務めるRachel Tobac氏はMotherboardに対して、「音声認証を活用しているすべての団体は、早急に多要素認証などの安全な本人確認方法に切り替えることをお勧めします。なぜなら、この種の音声の複製は、実生活でその人と会話しなくても可能だからです」と話しました。


AIの音声で認証を突破されてしまったLloyds Bankはサイト上で、「当行のVoice IDは指紋と同様に100種類以上の声の特徴を分析します。例えば、口や声帯の使い方、アクセント、話す速さなどです。風邪を引いているときや喉が痛いときでも認識できます」と案内しています。

Lloyds Bankによると、これまでのところAIが合成した音声により詐欺が行われたケースは報告されていないとのこと。また、同行は合成音声の脅威を認識してさまざまな対策を展開しており、Voice IDの導入によってテレフォンバンキングでの詐欺は大幅に減少したとしています。


実際、コックス氏はAIによる合成音声でLloyds Bankの口座にアクセスするテストを複数回にわたり実施し、失敗しています。上記の動画のテストに成功したのも、ElevenLabsに長い文章を読ませたり、自然な音程にしたりといった工夫を凝らした末のことでした。

ElevenLabsはMotherboardの問い合わせに応じませんでしたが、ElevenLabsの共同設立者であるMati Staniszewski氏は以前の声明で、「私たちの新しいセーフガードによりこのサービスの悪用例は急激に減少しています。また、私たちはユーザーの皆さんが追加措置を要する例を報告してくださっていることにも感謝しています。私たちは、もしこのサービスを悪用した法律違反があった場合には、そのユーザーを特定すべく当局を支援します」と述べています。

この記事のタイトルとURLをコピーする

・関連記事
AIでクローン音声を生成する最新ツールが4chan民により「エマ・ワトソンの声で『わが闘争』を読み上げさせる」など悪用されまくる事態に - GIGAZINE

まったく新しい合成音声をユーザーが独自設計できる生成モデル「Design Voice」 - GIGAZINE

Microsoftがたった3秒のサンプルから人の声を再現できる音声合成AI「VALL-E」を発表 - GIGAZINE

まったく新しい合成音声をユーザーが独自設計できる生成モデル「Design Voice」 - GIGAZINE

声優に「録音した音声でAIに合成音声を生成させることを認める」契約を迫るケースが増加、声優や組合からは反対の声 - GIGAZINE

in ソフトウェア,   セキュリティ, Posted by log1l_ks

You can read the machine translated English article here.