2024年05月15日 13時48分ソフトウェア

GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか？

GoogleのAI研究部門であるGoogle DeepMindが現地時間の2024年5月14日に、AI生成コンテンツにウォーターマーク(電子透かし)を入れてフェイク画像の拡散を防止するツール「SynthID」を、従来の画像だけでなくテキストと動画にも拡張することを発表しました。

More ways Google is delivering on its responsible AI commitment
https://blog.google/technology/ai/google-responsible-ai-commitment-update/

Watermarking AI-generated text and video with SynthID - Google DeepMind
https://deepmind.google/discover/blog/watermarking-ai-generated-text-and-video-with-synthid/

近年は生成AIの発展により、まるで本物のような画像や動画を誰でも手軽にAIで生成できるようになりました。しかし、これにはクリエイターが意図的あるいは無意識に誤った情報を広めるリスクもあるため、特定の画像や動画、テキストなどがAI生成コンテンツかどうかを見分ける仕組み作りが必要とされています。

2023年8月、Google DeepMindはAIで生成された画像に電子透かしを入れ、AIが生成した画像であることを示すツール「SynthID」を発表しました。SynthIDは画像のピクセルに電子透かしを埋め込むことで、メタデータを削除したり画像を編集したりしてもAI生成画像かどうかを見分けることを可能にしています。

Googleが「画像生成AIで生成した画像」に電子透かしを入れてフェイクの拡散を防止するツール「SynthID」を発表 - GIGAZINE

そして2024年5月14日、Google DeepMindはSynthIDの機能を拡張し、GoogleのAI・Geminiのアプリ版およびウェブ版で生成したテキストや、新たな動画生成AIモデル「Veo」が生成した動画にも電子透かしを入れることを発表しました。

動画は個々のフレームまたは静止画によって構成されているため、AI生成動画に入れるSynthIDの電子透かしの仕組みは画像向けのものと同様です。動画を構成するすべてのフレームのピクセルに電子透かしを埋め込み、人間の目では認識できないもののシステムがAI生成動画を識別可能にするとのこと。すでにVeoを活用した新たな動画生成ツール「VideoFX」で生成されるすべての動画に、SynthIDの電子透かしが入るとGoogle DeepMindは説明しています。

一方、AI生成テキストに埋め込む電子透かしの仕組みは、画像や動画とは異なります。大規模言語モデルは「5歳児に量子力学を説明して」「好きな果物は何？」といったプロンプトに対し、一連のテキストを生成しますが、この生成テキストは情報を処理する単位である「トークン」に基づいています。

トークンは個々の単語や文字を数値で表したもので、大規模言語モデルは「このトークンが現れた後、どのトークンが現れる可能性が高いのか」を予測することで、意味のあるそれらしい文章を生成しています。各トークンにはそれが正しいであろう確率のスコアが割り当てられており、スコアが高いトークンほど使用される可能性が高くなるとのこと。

SynthIDは、このテキスト生成プロセスにおけるトークンのスコアを、テキストの品質や正確性を損なわない程度に調整することで、生成されたテキストに「AIによく見られるパターン」を埋め込むという仕組みです。テキストのパターンを比較することで、SynthIDはAIツールがテキストを生成したのか、それとも人間など他のソースがテキストを生成したのかを見分けられるとGoogle DeepMindは主張しています。

実際にSynthIDの電子透かしが埋め込まれたテキストのうち、電子透かしの部分を青色で強調表示したものが以下。文全体が透かしになるわけではなく、一部の単語や語順、文章の構造などが透かしになっているようです。

SynthIDのテキスト向け電子透かしは、長めの応答やエッセイ、演劇の脚本、電子メールの文面といったさまざまなシチュエーションで機能します。また、文章のさまざまな部分に電子透かしが埋め込まれるため、テキストの一部を切り抜いたり、ところどころの単語を変更したり、文章の言い回しを多少調整したりしても電子透かしは有効だとのこと。

しかし、AIが生成したテキストが徹底的に書き直されたり、別の言語に翻訳されたりすると信頼度スコアが大幅に低下する可能性もあるそうです。また、電子透かしはテキストの言い回しに埋め込まれるため、ほとんどテキストの内容に幅がない短い応答や事実に基づくプロンプトでは精度が低下します。たとえば、「フランスの首都はどこ？」「ウィリアム・ワーズワースの詩を暗唱して」といった、文章のバリエーションがほとんど期待できない応答では、電子透かしがうまく機能しない可能性があります。

SynthIDのテキスト向け電子透かしはほとんどのテキスト生成AIと互換性があり、さまざまなコンテンツのタイプやプラットフォーム間でスケーリングできるよう設計されているとのこと。Googleは今後数カ月以内にSynthIDのテキスト向け電子透かしをオープンソース化し、より多くの開発者が責任を持ってAIを構築できるようにすると明言しました。

In the coming months, we’re also open-sourcing SynthID text watermarking through our updated Responsible Generative AI Toolkit to make it easier for more developers to build AI responsibly. #GoogleIO
— Google (@Google) May 14, 2024