キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた
ロンドンとカリフォルニアを拠点とするスタートアップ・Stability AIが、まるで人間のアーティストが描いたような高クオリティの画像を生み出せる画像生成AI「Stable Diffusion」を一般公開しました。モデルはCreative ML OpenRAIL-Mライセンスの下でリリースされており、商用での利用も許可されています。
Stable Diffusion Public Release — Stability.Ai
https://stability.ai/blog/stable-diffusion-public-release
CompVis/stable-diffusion · Hugging Face
https://huggingface.co/CompVis/stable-diffusion
Stable Diffusionの公開デモンストレーションには以下のページでアクセスできます。
Stable Diffusion - a Hugging Face Space by stabilityai
https://huggingface.co/spaces/stabilityai/stable-diffusion
使い方は非常に簡単で、Stable Diffusionに描画してほしいイメージを英語で入力して「Generate image」をクリックするだけ。今回は「girl with baloons on the beach」というキーワードを入力。
生成に数十秒待ちます。
「ビーチで風船を持つ女の子」を描いた3枚の絵が出力されました。出力される画像のサイズは512×512ピクセルです。
1枚目は非常にセクシーですが、女の子の顔がいかつく、こちらをにらみつけるような表情となっています。
2枚目はもっと幼い女の子が浜辺を歩いている様子。
3枚目は流される風船を浜辺で見つめる女の子という画像でした。
入力するキーワードは英語である必要がありますが、入力してから生成までの時間はかなり短く、画像としても精度は高めです。そこで、いろいろ入力してStable Diffusionに画像を生成してもらいました。
「A pikachu fine dining with a view to the Eiffel Tower」
「A mecha robot in a favela in expressionist style」
「Hiroshi Abe eat big soft cream in london」は、俳優の阿部寛氏を想定していたのですが、まったく知らないおじさんが登場。
「Spider man fight a dog in Akihabara」
なお、Stable Diffusionは記事作成時点でNVIDIAチップでの動作が推奨されていますが、AMDやApple M1/M2、およびその他のチップセットでの動作にも最適化するようアップデートを予定しているとのこと。また、パフォーマンスと品質が向上したバリアントおよびアーキテクチャも将来的にリリースされるそうです。
・つづき
画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ - GIGAZINE
・関連記事
風景写真家がAI画像ジェネレーター「Stable Diffusion」で非実在美景を生成 - GIGAZINE
まるで人間のアーティストが描いたような画像を生成するAIが「アーティストの権利を侵害している」と批判される - GIGAZINE
文章から高クオリティな画像を生成できるAI「DALL・E 2」を使ってTwitterのプロフィールから絵を生成してみるとこんな感じ - GIGAZINE
OpenAIがAI画像ジェネレーター「DALL・E2」の一般向け公開がスタート - GIGAZINE
・関連コンテンツ