ネットサービス

YouTubeで字幕付きムービーの数が10億本に到達、次に目指すはさらなる精度向上

By Esther Vargas

YouTubeのムービーには自動字幕起こし機能が搭載されていて、聴覚障害を持つ人だけでなく他言語の勉強や自国語ではないムービーの視聴がしたい人たちに利用されています。この自動字幕起こし機能で字幕を付けられたムービーの数が10億本を突破したことが明らかになっています。

Official YouTube Blog: One billion captioned videos
https://youtube.googleblog.com/2017/02/one-billion-captioned-videos.html

GoogleはGoogleビデオで投稿されているムービーに字幕を付ける機能を2006年に公開し、2009年にはYouTubeに自動字幕起こし機能を追加しました。公開当初こそユーザーが満足できるレベルの機能にはなっていなかったのですが、YouTubeにとっては大きな一歩でした。

自動字幕起こし機能が実装されて約7年が経過した2017年2月、同機能を用いて字幕の付けられたムービーが10億本を突破し、1日に視聴される字幕付きムービーは約1500万本に到達。公開されてから字幕機能は精度を日々向上してきたとのことですが、精度の向上に大きく貢献しているのがGoogleの音声認識技術です。YouTubeに投稿されるムービーは政治を扱うものからネコやゲームまで多種多様な内容を含んでおり、自動で字幕を付けるのはものすごく困難。しかし、音声認識技術や機械学習のアルゴリズム、トレーニングデータの拡張、ユーザーコミュニティからのフィードバックなどにより、公開当初から比べると精度は50%向上しています。

過去には「you」と認識していたところ……


最新の字幕機能では「YouTube」と表示できるようになっています。


ただし、50%精度が向上したといっても、まだまだ実際の音声とは異なる字幕を表示することも多々あります。例えば、映画「シビル・ウォー/キャプテン・アメリカ」予告編の1シーンでは「Washington, DC」という部分が「Washington this thing」と訳されています。また、英語以外の言語の字幕付きムービーの数が少ないと感じるユーザーもいます。


YouTubeは今後も字幕の正確性を改善していくことに注力し、さらに英語、オランダ語、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、ロシア語、スペイン語の合計10カ国語に対応している言語を増やすことも計画中とのことです。

この記事のタイトルとURLをコピーする

・関連記事
YouTubeの抜け穴を利用してポルノ映像が共有されている - GIGAZINE

Google翻訳のAIは独自の「中間言語」を習得して「学習してない言語間の翻訳」すら可能な段階に突入 - GIGAZINE

YouTubeで2016年に最も人気だったムービー・ミュージックビデオ・CMトップ10はこんな感じ - GIGAZINE

Google翻訳は人間レベルの翻訳精度を目指して人工知能を活用 - GIGAZINE

YouTube・Vimeo・SoundCloudのアドレスをコピペすれば簡単にダウンロードできる「Offliberty」 - GIGAZINE

Google翻訳アプリの新機能「リアルタイム カメラ翻訳」を使いまくってみた - GIGAZINE

YouTubeを視聴&ダウンロード可能な公式アプリ「YouTube Go」が登場 - GIGAZINE

in ネットサービス,   動画, Posted by darkhorse_log

You can read the machine translated English article here.