2022年09月01日 19時00分 レビュー

話題の画像生成AI「Stable Diffusion」で使える呪文のような文字列を実際の画像から見つけられる「Lexica」の使い方まとめ



テキストから高クオリティの画像を生成できるAI・Stable Diffusionが話題になる様子を見て、「自分も何か画像を作らせてみたい!」と興味を持っている人は多いはず。Stable Diffusionで画像を生成する際に重要になるのが「どんなテキストを入力するのか」という点で、AIの動作を調べて有効だと判明した文字列は「呪文」とも呼ばれています。そんなStable Diffusionで使える呪文のような文字列を、実際に生成された画像から見つけることができるサービス「Lexica」が登場していたので、実際に使ってみました。



Lexica

https://lexica.art/



Stable DiffusionはNVIDIA製GPUを搭載したマシンのローカル環境で実行できるほか、デモページからでも使用できます。しかし、NVIDIA製GPUを所有していない人やデモページの待ち時間が長すぎると感じる人は、Googleが提供しているPython実行環境「Colaboratory」を利用してStable Diffusionをスムーズに使うことができます。



画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ - GIGAZINE





また、Stable Diffusionを一発でWindows環境にインストールして、グラフィックユーザーインターフェース(GUI)で簡単に画像生成できる「NMKD Stable Diffusion GUI」というツールも公開されており、以下の記事で説明されている手順で手軽に導入できます。



画像生成AI「Stable Diffusion」をWindows環境にボタン1つでインストール可能&GUIで操作できる「NMKD Stable Diffusion GUI」がついに登場 - GIGAZINE





Lexicaのトップページにアクセスするとこんな感じ。初期設定だと画像表示の方式が「Grid」に設定されています。





画面を下にスクロールすると、Stable Diffusionで生成されたさまざまな画像が一覧表示されます。





カーソルで画像を選択し、クリックすると……





その画像を生成するために使った文字列を見ることができます。この画像は「An illustration of half empty earth with a drinking straw stuck in, vibrant colors, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, cinematic lighting, art by artgerm and greg rutkowski and alphonse mucha(ストローが刺さった半分空の地球のイラスト、鮮やかな色、非常に詳細、デジタルペインティング、ArtStation、コンセプトアート、滑らか、鋭いフォーカス、イラスト、映画のような照明、Stanley ArtgermやGreg Rutkowski、アルフォンス・ミュシャによるアート)」という呪文で生成されたものだそうです。





「Copy prompt」をクリックすることで文字列をコピーでき、「Copy URL」をクリックするとこの文字列で生成された画像を一覧表示するページのURLをコピーできます。





「Copy URL」でコピーしたURLを開き、同じ文字列で生成された画像を一覧表示してみるとこんな感じ。それぞれ構図や描いているものはさまざまですが、コンセプトや雰囲気などは統一感がありました。





また、トップページから画像表示方式を「List」にすると、左端に画像生成に使用した文字列が表示され、その右側に生成した画像が表示されます。





List方式でさまざまな画像を眺めることで、「これはいいな……」と思えるものを見つけやすくなります。





たとえば「A full body portrait of a woman explorer exploring lost ruins, sun lighting, water, finely detailed features, perfect art, at an ancient city, gapmoe yandere grimdark, trending on pixiv fanbox, painted by greg rutkowski makoto shinkai takashi takeuchi studio ghibli, emerald herald(失われた遺跡を探索する女性探検家の全身像、太陽の光、水、細かい特徴、完璧なアート、古代都市、ギャップ萌えヤンデレグリムダーク、Pixiv Fanboxでトレンド、Greg Rutkowski、新海誠、武内崇、スタジオジブリ、エメラルド・ヘラルドによって描かれた)」で生成した画像がこれ。





「Baroque oil painting japanese light novel cover illustration anime key visual full body action shot | military dictator young girl wearing black crusader armour with long flowing blonde hair | lotr gapmoe kuudere moody lighting bokeh stunning highlights sharp contrast | trending pixiv fanbox | by makoto shinkai greg rutkowski takashi takeuchi ufotable studio ghibli(バロック様式の油絵、ライトノベルの表紙イラスト、アニメのキービジュアル、全身、アクションショット|軍事独裁者の黒い十字軍の鎧を着て長い金髪の若い女の子|ロートルギャップ萌えクーデレ、ムーディな照明、ボケ、見事なハイライト、シャープなコントラスト|Pixiv Fanboxのトレンド|新海誠、Greg Rutkowski、武内崇、ufotable、スタジオジブリ)」





「A busy funfair, helicopters, panoramic, perfect art, trending on pixiv fanbox, painted by greg rutkowski makoto shinkai takashi takeuchi studio ghibli, akihiko yoshida(にぎやかな遊園地、ヘリコプター、パノラマ、パーフェクトアート、Pixiv Fanboxのトレンド、Greg Rutkowski、新海誠、竹内孝、スタジオジブリ、吉田明彦のイラスト)」





「Interior of an office belonging to a senior member of the kitsune adventurer's guild | | colorful, anime, a fantasy digital painting by makoto shinkai, greg rutkowski, and james gurney, trending on artstation, highly detailed(キツネの冒険者ギルドの上級メンバーのオフィス内部|カラフル、アニメ、新海誠、Greg Rutkowski、James Gurneyによるファンタジーデジタルイラスト、ArtStationのトレンド、高精細)」





「A painting of an ancient underground dungeon temple, intricate, elegant, highly detailed, swirly magic ripples, gaudy colors, organic painting, anime keyframe, by greg manchess, huang guangjian, gil elvgren, sachin teng, greg rutkowski, jesper ejsing, ilya kuvshinov(古代の地下神殿の絵画、複雑、優雅、非常に詳細、渦巻く魔法の波紋、派手な色、有機的な絵画、アニメのキーフレーム、Greg Manchess、Huang Guangjian、Gil Elvgren、Sachin Teng、Greg Rutkowski、Jesper Ejsing、Ilya Kuvshinovによって描かれた)」





「Beautiful lifelike award winning pencil illustration of ayanami rei trending on art station artgerm greg rutkowski alphonse mucha museum quality cinematic atmospheric(ArtStationでトレンドになった綾波レイの美しい実物大の鉛筆イラスト、Greg Rutkowski、アルフォンス・ミュシャ、博物館クオリティの映画的雰囲気)」





今回は「A young girl white hair in front of a fan of her bedroom, in a heat day, by dustin nguyen, akihiko yoshida, greg tocchini, greg rutkowski, cliff chiang, 4 k resolution, trending on artstation(暑い日に寝室の扇風機の前にいる白髪の女の子、Dustin Nguyen、吉田明彦、Greg Tochini、Greg Rutkowski、Cliff Chiang、4K解像度、アートステーションのトレンド)」という文字列を使い、実際にStable Diffusionで画像を生成してみることにします。





Windows環境にインストールした「NMKD Stable Diffusion GUI」のプロンプト入力フォームにコピーした文字列を入力し、「Generate!」をクリックすると……





画像が生成されました。





生成した画像の保存フォルダを確認するとこんな感じ。シード値やパラメータが違う部分があるため、Lexicaにあった画像とは異った画像が生成されましたが、全体的な雰囲気や対象物はほぼ同じです。





また、ほとんど同じプロンプトですが、「A young girl white hair(白髪の女の子)」を「A young girl black hair(黒髪の女の子)」に変えて画像を生成してみると……





しっかり黒髪の女の子が描かれました。





フォルダを確認するとこんな感じ。Lexicaでコンセプトや方向性が近い画像の文字列を探し、ところどころ単語を差し替えることで、自分が理想としている画像を生成するのに役立てることができます。





なお、Stable Diffusionのテキスト入力については、生成する画像の精度を向上させる「チートシート」も有志によって公開されています。



Stable Diffusion prompting cheatsheet | Moritz' Blog

https://moritz.pm/posts/parameters