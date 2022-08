2022年08月23日 14時00分 レビュー

キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた



ロンドンとカリフォルニアを拠点とするスタートアップ・Stability AIが、まるで人間のアーティストが描いたような高クオリティの画像を生み出せる画像生成AI「Stable Diffusion」を一般公開しました。モデルはCreative ML OpenRAIL-Mライセンスの下でリリースされており、商用での利用も許可されています。



Stable Diffusion Public Release — Stability.Ai

https://stability.ai/blog/stable-diffusion-public-release



CompVis/stable-diffusion · Hugging Face

https://huggingface.co/CompVis/stable-diffusion



Stable Diffusionの公開デモンストレーションには以下のページでアクセスできます。



Stable Diffusion - a Hugging Face Space by stabilityai

https://huggingface.co/spaces/stabilityai/stable-diffusion



使い方は非常に簡単で、Stable Diffusionに描画してほしいイメージを英語で入力して「Generate image」をクリックするだけ。今回は「girl with baloons on the beach」というキーワードを入力。





生成に数十秒待ちます。





「ビーチで風船を持つ女の子」を描いた3枚の絵が出力されました。出力される画像のサイズは512×512ピクセルです。





1枚目は非常にセクシーですが、女の子の顔がいかつく、こちらをにらみつけるような表情となっています。





2枚目はもっと幼い女の子が浜辺を歩いている様子。





3枚目は流される風船を浜辺で見つめる女の子という画像でした。





入力するキーワードは英語である必要がありますが、入力してから生成までの時間はかなり短く、画像としても精度は高めです。そこで、いろいろ入力してStable Diffusionに画像を生成してもらいました。



「A pikachu fine dining with a view to the Eiffel Tower」





「A mecha robot in a favela in expressionist style」





「Hiroshi Abe eat big soft cream in london」は、俳優の阿部寛氏を想定していたのですが、まったく知らないおじさんが登場。





「Spider man fight a dog in Akihabara」





なお、Stable Diffusionは記事作成時点でNVIDIAチップでの動作が推奨されていますが、AMDやApple M1/M2、およびその他のチップセットでの動作にも最適化するようアップデートを予定しているとのこと。また、パフォーマンスと品質が向上したバリアントおよびアーキテクチャも将来的にリリースされるそうです。