ソフトウェア

画像生成AIでさまざまなだまし絵を自動生成する「Visual Anagrams」


見る方向や絵の形を変えることで、意味や見た目が変わってしまう「だまし絵」を、拡散モデルの画像生成AIで自動生成する技術「Visual Anagrams」をミシガン大学の研究チームが発表しました。

[2311.17919] Visual Anagrams: Generating Multi-View Optical Illusions with Diffusion Models
https://arxiv.org/abs/2311.17919


Visual Anagrams
https://dangeng.github.io/visual_anagrams/


Jigsaw Permutations」はジグソーパズルのように絵を分解して組み立てると別の絵になります。例えば、以下のだまし絵では、シカの絵を分解して組み立てると、キッチンの絵になっているのがわかります。


アインシュタインの肖像画が、観葉植物の絵に。


180度ひっくり返すと別の絵になる「Flips and 180° Rotations」の一例として作成されたのが以下。老婆の顔をひっくり返すと、ドレスを着た女性の写真になります。


ペンギンの絵を180度ひっくり返すと、キリンの顔になりました。


雪山の絵を時計回りに90度回すと馬の絵になりました。90度回転させると別の絵になる「90° Rotations」です。


山小屋の絵は帆船の絵になります。


Color Inversions」は白黒を反転させると別の絵に見えるというだまし絵。例えば以下の例だと、左側がウサギの写真に、右側はテディベアの写真に見えます。


左側は愁いを帯びた女性の横顔、右側は少し微笑む男性の横顔。


絵の一部を変形させたり回転させたりすると別の絵になるというのが、「Miscellaneous Permutations」というだまし絵。例えば、マリリン・モンローの肖像画の顔部分だけを回転させると、アインシュタインの肖像画になります。


革張りの椅子の絵かと思ったら、中央を回転させるとヒゲを生やした男性の肖像画に。


Random Patch Permutations」は絵を細かく分解して再構築すると別の絵になるというもの。例えば、以下のウサギのモザイク画をバラバラにして組み立て直すと、カモの絵になります。


青年を描いた絵を分解して再構築したところ、老人の絵に変化しました。


Visual Anagramsのプロセスを示したのが以下の図。一般的な拡散モデルを使い、だまし絵のパターンごとにノイズを生成し、そのノイズの推定値を平均化しています。


Visual Anagramsのソースコードは以下のGitHubリポジトリで公開されています。

GitHub - dangeng/visual_anagrams: Code for the paper "Visual Anagrams: Generating Multi-View Optical Illusions with Diffusion Models"
https://github.com/dangeng/visual_anagrams

この記事のタイトルとURLをコピーする

・関連記事
脳が混乱する「錯視映像オブ・ザ・イヤー」の2020年受賞作品が発表される、大賞には日本人が輝く - GIGAZINE

「だまし絵」のような構造物を現実に作り出す方法を公開した「Impossible or illusion??」 - GIGAZINE

480円が無料に、騙し絵の中を冒険するパズルゲームの傑作「Monument Valley」がApp StoreとAmazonで無料で提供中 - GIGAZINE

あるはずのない光線が見える新たな錯視が報告される - GIGAZINE

正面から見る際と鏡に映ったものとでは屋根の形が異なる錯視作品「変身するガレージ屋根」 - GIGAZINE

in ソフトウェア,   アート, Posted by log1i_yk

You can read the machine translated English article here.