ソフトウェア

Googleがムービーの自動吹替&リップシンクAIを開発中、声色を変えずに吹替可能で高性能すぎて悪用注意とのこと


2023年5月11日(木)に開催された「Google I/O 2023」の基調講演で、ムービーの吹替音声を自動生成しつつ口の動きも変化させられるAI技術「Universal Translator」が発表されました。

Google I/O 2023
https://io.google/2023/intl/ja/

Universal Translatorの発表は以下のムービーの1時間14分38秒頃から確認できます。

Google Keynote (Google I/O ‘23) - YouTube


Universal Translatorはムービー内の音声を認識し、声色を変えずに別の言語へ翻訳するAIです。GoogleはUniversal Translatorを用いて大学のオンライン講義を自動吹替するデモを公開しています。


オリジナルのムービーは英語で講義が進められます。


吹替版のムービーでは、オリジナルムービーと同じ声色を保ちつつ別の言語で講義が進みます。また、音声に合わせて口の動きも変化しています。


Universal Translatorは「翻訳」「イントネーションの調整」「話者の声色を再現した音声の生成」「口の動き調整」という段階を経て吹替機能を実現しているとのこと。


Universal Translatorの吹替機能は非常に強力ですが、ディープフェイクの制作などに悪用される可能性もあります。このため、GoogleはUniversal Translatorを認証されたパートナーにのみ提供するとのことです。

この記事のタイトルとURLをコピーする

・関連記事
Google初の折りたたみスマホ「Pixel Fold」や大規模言語モデル「PaLM 2」などが発表された「Google I/O 2023」まとめ - GIGAZINE

Googleが「知らない言語」も翻訳処理ができてしまう言語モデル「LaBSE」を発表 - GIGAZINE

300以上の言語で訓練されたGoogleの翻訳AI「Universal Speech Model(USM)」の最新情報が公開、将来的に1000以上の言語を翻訳可能にする計画 - GIGAZINE

Googleからプログラミング補助AI「Studio Bot」登場 - GIGAZINE

Googleが大規模言語モデル「PaLM 2」を発表、すでに25のGoogleサービスに導入済み - GIGAZINE

Googleが遠く離れた人と実際に顔を合わせて会話しているかのような「魔法の鏡」を開発する「Project Starline」の最新プロトタイプを公開 - GIGAZINE

AIを駆使した音声翻訳システムをMetaが公開、テキストデータの収集が困難なマイナー言語にも対応 - GIGAZINE

in ソフトウェア,   動画, Posted by log1o_hf

You can read the machine translated English article here.