Googleの音声認識を利用してreCAPTCHAを突破できると研究者が発表
ボットではないことを証明するために入力するCAPTCHAやreCAPTCHAに難題をふっかけられイライラした人も多いはず。メリーランド大学カレッジパーク校の研究者は、このreCAPTCHAをGoogleのSpeech-to-Textを使って突破できる新たな手法「unCaptcha v2」を発表しています。unCaptcha v2を使ってreCAPTCHAをだませる確率は約90%だそうです。
unCaptcha: A Low-Resource Defeat of reCaptcha’s Audio Challenge
http://uncaptcha.cs.umd.edu/
Researchers Fool ReCAPTCHA With Google’s Own Speech-To-Text Service - Motherboard
https://motherboard.vice.com/en_us/article/pa55z8/researchers-fool-recaptcha-with-googles-own-speech-to-text-service
研究者の発表した手法は、音声CAPTCHAをダウンロード、個々の音声クリップに分割し、このクリップをGoogleを含む複数のSpeech-to-Text(文字起こしサービス)にアップロードして元の状態に復元させるというもの。unCaptchaは何度か同音異義語を当てずっぽうで試したのちに、正解に最も近い答えをはじきだし、CAPTCHAの入力欄に答えを入力します。実際にreCaptchaを使うウェブサイトで実験が行われたところ、この方法の正解率は85.15%、正解するまでにかかる時間は平均5.42秒だったとのことです。
上記の研究は2017年に行われたものですが、研究者の発表後、Googleはブラウザの自動検出の性能を向上させるなどしてunCaptchaを可能にしていた抜け穴をいくつか修正しました。しかし、研究者らはさらに研究を続けることでunCaptchaをアップデート。Googleを出し抜く形で、正確性を以前よりも向上させ90%にした「unCaptcha v2」を発表しました。
研究者は過去6カ月間にわたってGoogleのReCaptchaチームにコンタクトを取っており、Googleは新たな手法に気づいているはずですが、気に留めていない様子とのこと。「現時点での成功にも関わらず、チームは我々にコードのリリースを許した」と研究者は述べています。
なお、unCaptcha v2のコードは以下で公開されています。
GitHub - ecthros/uncaptcha2: defeating the latest version of ReCaptcha with 91% accuracy
https://github.com/ecthros/uncaptcha2
・関連記事
無力感で心が折れそうなほどある意味ひどい認証用のCAPTCHA画像まとめ - GIGAZINE
機械学習を使ってCAPTCHAをわずか15分で突破するチャレンジが行われる - GIGAZINE
「ニンゲンキライ」とばかりに人間だけを弾くCAPTCHA認証が登場 - GIGAZINE
Googleの新たなreCAPTCHAは文字入力も画像選択も不要な「不可視」仕様 - GIGAZINE
歪んだ文字や数字を入力する「CAPTCHA」を突破できるマルウェアが出現、どういう仕組みなのか? - GIGAZINE
・関連コンテンツ