レビュー

画像生成AI「Krea 2」がオープンモデル化されてローカル生成可能になったのでComfyUIで実写風画像とイラスト風画像を生成してみたよレビュー


AI開発企業のKreaが画像生成AI「Krea 2」をオープンモデル化しました。Krea 2は実写風画像もイラスト風画像も高品質に生成可能。すでにComfyUIでも生成可能になったので、実際にいろいろ生成してみました。

Krea 2 Technical Report - Krea
https://www.krea.ai/blog/krea-2-technical-report


Krea 2はファインチューニング用のベースモデルである「Krea 2 Raw」とファインチューニングと蒸留を施した「Krea 2 Turbo」の2種類がオープンモデルとして公開されています。どちらのモデルもパラメーター数は120億で、ラインセンスは一定の条件下で商用利用が可能な「Krea 2 Community License Agreement」を採用しています。

krea/Krea-2-Raw · Hugging Face
https://huggingface.co/krea/Krea-2-Raw

krea/Krea-2-Turbo · Hugging Face
https://huggingface.co/krea/Krea-2-Turbo

Krea 2 Turboの生成例が以下。


AIの名前を伏せつつ人間に品質を評価させるDesign Arenaの画像生成ランキングでは、Krea 2 TurboはFLUX.2より高品質だと評価されています。


実際に、ComfyUIでKrea 2 Turboを使った画像生成を試してみます。まずComfyUIを最新版にアップデートしてテンプレート一覧画面で「krea」などのフレーズで検索して「Krea-2:テキストから画像へ」をクリックします。記事作成時では「Krea-2:テキストから画像へ」は2個登録されていて、サムネイルの左上に「Krea」と記されていない方が今回実行するKrea 2 Turboのテンプレートです。左上に「Krea」と記されている方はKreaのAPIを用いて画像生成するテンプレートなので注意。


テンプレートを開いたら右上の「不足しているモデルを表示」をクリック。


「すべてダウンロード」をクリックして必要なモデルをダウンロードします。合計ファイルサイズは17.8GBなので回線状況によってはかなり待つ必要あり。モデルのダウンロードが完了したらComfyUIを再起動します。


再起動してワークフローを開き直したら右上の「実行する」をクリック。


しばらく待つとあらかじめ入力されているプロンプトに沿ったサンプル画像が出力されます。


サンプル画像はこんな感じ。実写と手描きイラストが混在する画像を正しく指示通りに描写できています。


いろいろプロンプトを書き換えて生成してみます。テンプレートの初期状態だと「krea2-warmpastel」というLoRAが有効になっているので、無効化するためにグループ(青いエリア)を右クリックして「Byapass Group Nodes」をクリックしておきます。


後は「Text to Image」の入力欄にプロンプトを入力して「実行する」をクリックすればOK。


日本語で『路地裏で室外機の上に座って新聞を読むメイドさん。日本人。髪の毛は青色の黒色と青色のグラデーション。新聞には「GIGAZINE」と書いてある』と入力した結果が以下。「路地裏」「室外機に座る」「メイド」「髪の毛のグラデーション」「新聞の文字」をすべて指示通りに描写できています。

プロンプト:路地裏で室外機の上に座って新聞を読むメイドさん。日本人。髪の毛は青色の黒色と青色のグラデーション。新聞には「GIGAZINE」と書いてある

ポートレートも生成。

プロンプト:メイドさん。ポートレート。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き

「スマートフォンで素人が撮影したようなブレのある写真」という指示を追加するとAIっぽさがかなり抑えられます。

プロンプト:メイドさん。ポートレート。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。スマートフォンで素人が撮影したようなブレのある写真。

イラスト風画像も高品質に生成可能。

プロンプト:メイドさん。ポートレート構図のイラスト。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ

水彩画風にしてみました。

プロンプト:メイドさん。ポートレート構図のイラスト。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ。水彩画

アニメ塗り。

プロンプト:メイドさん。ポートレート構図のイラスト。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ。アニメ塗り

ゴッホ風。

プロンプト:メイドさん。ゴッホが描いたポートレート構図の絵画。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ

テンプレートのワークフローには「人間が入力したプロンプトをKrea 2で高品質画像を生成できるように書き換えるプロンプトエンハンサー」が含まれており、単純に画像を生成するより時間がかかります。「AMD RYzen 5 7600X」と「NVIDIA GeForce RTX 5070Ti」を搭載したWindows PCで1024×1024ピクセルの画像を生成した結果、プロンプトを書き換えた場合は16~25秒、同じプロンプトを使い回す場合は9~15秒程度で生成できました。Kサンプラーのステップ数は初期設定の8のまま生成しています。


生成中のGPUへの負荷はこんな感じ。VRAM容量16GBのRTX 5070Tiで問題なく生成できました。


上述の通り、Krea 2はベースモデルの「Krea 2 Raw」と蒸留済みの「Krea 2 Turbo」が公開されています。LoRA作成ツールのMusubi TunerもすでにKrea 2をサポートしており、RTX 6000 Pro Blackwellで15分程度でLoRAを作成できるそうです。


・関連記事
画像生成AIをPCで簡単に実行できる「ComfyUI」のインストール手順&最初の画像を生成するまでの手順まとめ - GIGAZINE

アニメ・イラストに強い画像生成AI「Anima」の正式版がついに登場、タグ・自然言語両対応でSDXLやIllustrious系モデルが動作するPCなら余裕でローカル実行可能 - GIGAZINE

Nano Banana Pro超えでローカルで実行可能な画像生成AI「Ideogram 4.0」が登場、日本語での指示も可能 - GIGAZINE

OpenAIが画像生成AI「ChatGPT Images 2.0」を正式リリースしたので使ってみた、イラストも日本語セリフも高品質に描写可能 - GIGAZINE

画像生成AI「BitDance」をTikTok開発元の研究者らが公開したので使ってみた、Z-Imageより速くて高品質をアピールする自己回帰モデル - GIGAZINE

Baiduがイラストも実写風も生成できる画像生成AI「ERNIE-Image」を公開、ローカルで実行可能&ユーザーの入力に自動追記して高品質プロンプトを作る機能も - GIGAZINE

iPhoneでローカル動作する画像生成AI「Bonsai Image 4B」が登場したので使ってみた、FLUX.2 Klein 4Bを1bit版に魔改造してメモリ使用量を8.3分の1に削減 - GIGAZINE

ゲームみたいに移動可能な世界をリアルタイム生成できるAI「HappyOyster 1.0」が登場したので使ってみた - GIGAZINE

・関連コンテンツ

in AI,   レビュー, Posted by log1o_hf

You can read the machine translated English article The image generation AI 'Krea 2' has bee….