ソフトウェア

画像生成AI「Stable Diffusion」「Adobe Firefly」「Midjourney」の特徴が一発で分かる「同じテキスト」から生成した画像たち


無料で使える「Stable Diffusion」やAdobeが提供する「Adobe Firefly」など手軽に使える画像生成AIが続々と登場しています。画像生成AIは基本的に「生成したい画像を説明するテキスト(プロンプト)を入力する」という形式で使用可能ですが、AIの種類やモデルデータが変化すると生成結果もまったく別物に変化します。テクノロジー関連ライターのMuhammad Usman氏は「Adobe Firefly」「DALL・E2」「OpenJourney」「Stable Diffusion」「Midjourney」といった主要な画像生成AIに同じプロンプトを入力した際の生成結果をまとめています。

Comparing Adobe Firefly, DALL・E2, OpenJourney, Stable Diffusion, and Midjourney
https://blog.usmanity.com/comparing-adobe-firefly-dalle-2-and-openjourney/

「Adobe Firefly」「DALL・E2」「OpenJourney」「Stable Diffusion」「Midjourney」それぞれの概要は以下の通り。

Adobe Firefly:Adobeが開発した画像生成AI。学習にはAdobe Stock内の画像やパブリックドメインの画像が使われており、著作権的にクリアな画像を生成可能。
DALL・E2:Open AIが開発した画像生成AI。最初の数枚は無料で生成可能で、規定枚数を超えると有料のクレジットが必要。
OpenJourney:Stable Diffusionを調整してMidjourneyに近い生成結果を得られるようにした画像生成AI。
Stable Diffusion:Stability AIが開発した画像生成AI。モデルデータや開発コードがオープンソース化されており、コミュニティによって派生モデルやツールが数多く開発されている。Usman氏がまとめたStable Diffusion製画像は掲示板Hacker Newsユーザーのkouteiheika氏が生成したもので、モデルデータは「Ultimate Diffusion」を使用している。
Midjourney:Discord上でサービスを提供している画像生成AI。手軽に高品質な画像を生成できることが話題になっている。

◆プロンプトその1
比較検証に使われた1つ目のプロンプトが以下。ざっくり訳すと「高画質なリビングルームのインテリア写真。木製の床や庭が見える小さい窓がある。ベージュ、青、サーモンピンクを使う」といった内容です。

High resolution photography interior design, dreamy sunken living room conversation pit, wooden floor, small windows opening onto the garden, bauhaus furniture and decoration, high ceiling, beige blue salmon pastel palette, interior design magazine, cozy atmosphere; 8k, intricate detail, photorealistic, realistic light, wide angle, kinkfolk photography, A+D architecture


Adobe Fireflyでの生成結果は以下。落ち着いた色調で、特に違和感はありません。


DALL・E2で生成した画像は、遠目に見ると違和感少なめですが、拡大して観察すると家具の輪郭があやふやです。


OpenJourneyでは絵画っぽい画像が生成されました。


Stable Diffusion(モデル:Ultimate Diffusion)の生成結果はこんな感じ。光や影が美しく表現されていますが、よく観察すると物理的にあり得ない影が生成されています。


Midjourneyの生成画像は、全体的に丸っこい家具が多めです。


◆プロンプトその2
2個目のプロンプトは以下。ざっくり訳すと「おとぎ話に登場するようなツリーハウスのある谷。マットな絵柄」といった感じ。

valley, fairytale treehouse village covered, matte painting, highly detailed, dynamic lighting, cinematic, realism, realistic, photo real, sunset,detailed, high contrast, denoised, centered


Adobe Fireflyでは村を遠くから撮影したような画像が生成されました。3枚とも建物の屋根が円すい形です。


DALL・E2では緑あふれる村が生成されました。


OpenJourneyだとこんな感じ。


Stable Diffusion(モデル:Ultimate Diffusion)では何層にも重なった家が生成されました。どの家もかなり不安定な土地の上に建てられています。


Midjourneyでは村の中に木製の道が描かれました。他のAIと比べて1枚の画像の中に表示される家の数が多めです。


◆プロンプトその3
3個目のプロンプトは以下。直訳すると「亡霊が出る幽霊屋敷、不気味な影、そこら中に秘密が潜んでいる」となります。

a haunted house with ghostly apparitions, eerie shadows, and mysterious secrets lurking in every corner


Adobe Fireflyでは「霧に包まれた洋館」の画像が生成されました。3枚目にはハロウィーンでよく見るジャック・オー・ランタンが写り込んでいます。


DALL・E2ではイラストっぽい画像が生成されました。


OpenJourneyは寂れた洋館の内装を生成。彩度が低めなのが特徴的。


Stable Diffusion(モデル:Ultimate Diffusion)では写実的な画像が生成されました。1枚目の画像は傾いた構図で不気味さが表現されています。


Midjourneyで生成した画像は以下。洋館を下から仰ぎ見る構図で、洋館の上には月が描かれています。

この記事のタイトルとURLをコピーする

・関連記事
ジェネレーティブAIの「Adobe Firefly」では「マリオ」「ピカチュウ」などの著作権で保護されたコンテンツが回避されるというのがよく分かる「Midjourney」との比較画像 - GIGAZINE

AIはフォトストック業界を殺すのか? - GIGAZINE

画像生成AI「Stable Diffusion」でスマホでもわずか1枚2秒という爆速で画像生成ができる「SnapFusion」 - GIGAZINE

Adobeが画像生成AI「Firefly エンタープライズ版」で作った画像で訴訟された場合は全額補償すると発表、自社AIは権利侵害していないという自信の表れ - GIGAZINE

in ソフトウェア, Posted by log1o_hf

You can read the machine translated English article here.