ソフトウェア

高画質画像生成AI「Stable Diffusion 3」発表、画像生成AIが苦手とする「指定した文字の描写」「複数の被写体の描写」などを高精度に実現可能


Stability AIが画像生成AI「Stable Diffusion 3」を2024年2月23日(金)に発表しました。Stable Diffusion 3では従来の画像生成AIでは困難だった「指定した文字を生成画像内に違和感なく描写」「複数の被写体を高精細に描写」といった操作が可能です。

Stable Diffusion 3 — Stability AI Japan
https://ja.stability.ai/blog/stable-diffusion-3


以下はStable Diffusion 3を用いて「cinematic photo of a red apple on a table in a classroom, on the blackboard are the words "go big or go home" written in chalk(教室の机の上にリンゴが置かれた映画風の写真、黒板にはチョークで『go big or go home』と記されている)」というプロンプトで生成した画像です。大文字と小文字の違いはあるものの、黒板に「GO BIG OR go HOME」という指示通りの単語が記されています。指示通りに「チョークで書いた文字」として描写されているのもポイント。


「a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words "stable diffusion"(チュチュを着用した豚に乗ったピンクの傘を持った宇宙飛行士の絵画、豚の隣の地面にはトップハットを着用したコマドリがいる、角には『stable diffusion』という語句が記されている)」というプロンプトで生成された画像が以下。「宇宙飛行士」「豚」「コマドリ」を指示通り描写できているほか、画像の左下に「STABLE DIFFUSION」という文字列が記されています。ただし、プロンプトでは「stable diffusion」と小文字で指示していたものの、生成画像では大文字で描写されているのが気になります。


「studio photograph closeup of a chameleon over a black background(黒い背景でカメレオンを接写したスタジオ写真)」だとこんな感じ。カメレオンの顔付近はクッキリ描写されて体部分はボケた描写になっており、マクロレンズで撮影したような雰囲気が出ています。


Stable Diffusion 3には800万~80億パラメータの複数のモデルが存在するとのこと。記事作成時点では先行プレビュー段階で、以下のリンク先からウェイトリストに登録できます。

SD 3 Waitlist — Stability AI
https://stability.ai/stablediffusion3

この記事のタイトルとURLをコピーする

・関連記事
高速かつ高品質&家庭用グラボでも簡単に追加学習可能な画像生成AIモデル「Stable Cascade」をStability AIが発表 - GIGAZINE

VRAM容量12GBの「GeForce RTX 4070 SUPER」は画像生成AIでどれだけの性能を発揮するのか?旧世代グラボと徹底比較してみたよレビュー - GIGAZINE

画像生成AIをノートPCでどれくらいの速度で動かせるのか、「Razer Blade 16」のVRAM容量16GB「GeForce RTX 4090 Laptop」で実際に試してみたよレビュー - GIGAZINE

無料お絵描きアプリ「Krita」に画像生成AIを組み込んで落書きから美麗イラストを作成する方法まとめ、Stable DiffusionとControlNetをコマンドなしでサクッと導入可能 - GIGAZINE

Googleがスマートフォンを使い0.5秒で画像生成できるアプローチ「MobileDiffusion」を発表 - GIGAZINE

Googleが無料で簡単に使える画像生成AI「Imagen 2」を公開したので使ってみた - GIGAZINE

テキストから物理法則をシミュレートしながら動画を生成するAI「Sora」をOpenAIが発表 - GIGAZINE

in ソフトウェア,   アート, Posted by log1o_hf

You can read the machine translated English article here.