PhotoGuardは、画像生成AIの「データをエンコーダーで処理する段階」と「ノイズを画像に変換する段階」の両方の段階に対して敵対的攻撃を行えます。「データをエンコーダーで処理する段階」に対する攻撃を行った場合の例が以下。AIに「Dog under heavy rain and muddy ground(激しく雨が降る泥の地面にイヌがいる)」というプロンプトを与えた場合、PhotoGuardを適用した画像(Edited Immunized Image)では元の画像の要素が無視され、プロンプトの内容だけが画像に反映されています。

近年のAIを用いた画像生成技術の向上によって、元の画像を違和感なく改変して偽の情報を作り出せる状況が生まれています。そんな中、マサチューセッツ工科大学の ハディ・サルマン氏 らが目に見えない改変を画像に加えてAIによる加工を防止するシステム「 PhotoGuard 」を発表しました。 GitHub - MadryLab/photoguard: PhotoGuard: Defending Against Diffusion-based Image Manipulation https://github.com/MadryLab/photoguard PhotoGuard: Defending Against Diffusion-based Image Manipulation – gradient science https://gradientscience.org/photoguard/ サルマン氏らは DALL-E のような画像生成AIによって画像の生成や加工が単純な自然言語だけで可能になったとする一方、悪意のある画像編集が行われるリスクが大きくなったと指摘しています。以下の画像はAIを用いた画像編集を行った例です。元の画像(Original Image)をAIに入力し、「Two men ballroom dancing(2人の男性がボールルームで踊っている)」という文章(プロンプト)を入力すると、右側の画像のような違和感のない画像に改変されてしまいます。

