2025年09月11日 11時00分 ソフトウェア

TikTok運営元のByteDanceが画像生成AI「Seedream 4.0」をリリースしました。Seedream 4.0は最大4Kの画像を生成可能で、単純な「テキストからの画像生成」だけでなくモデルの知識や推論を活用した画像生成にも対応しています。さらに、高品質な画像編集機能も備えており、各種ベンチマークではGoogleやOpenAIの製品を上回るスコアを記録しています。



Seedream 4.0

https://seed.bytedance.com/en/seedream4_0



Seedream 4.0では入力した画像の特徴を引き継ぎつつ新たな画像を生成することが可能。例えば、以下の画像とともに「画像を参考に、女の子の外見や服装は変更せずに『上から撮影した写真』『見上げながら撮影した写真』『背後から撮影した写真』を生成して(Refer to this image, generate three images from different views:360-degree overhead view, an elevated view, and a back view. Don't change the girl's appearance and outfit.)」というテキストを入力します。





生成結果が以下。被写体の見た目や服装、髪型、周囲の景色などを維持できています。





ロゴ画像を入力して、複数の製品画像を生成することもできます。





生成結果はこんな感じ。紙袋や帽子などにロゴがそのままプリントされたような画像を生成できました。





複数の画像を入力して各要素を1枚の画像にまとめることもできます。





入力画像に含まれる「白いドレスを着た女性」「銀色のバイク」「銀色のパラシュート」などの要素がそのまま引き継がれました。





AIモデルの知識や推論を活用した生成も可能です。例えば、方程式を与えるだけで途中式と解答を推論し、その内容を画像に出力することが可能。





「アイスクリームのレシピを英語で書いて」と指示するだけで細かな手順を出力してくれます。





入力画像の大部分を維持したまま編集することもできます。以下の写真の手前に写る人物を消すように指示。





人物が写っていた部分だけがキレイに消えました。他の部分はそのまま維持されているのがポイントです。





文字の書き換えも可能。





白黒写真をカラー化することもできます。入力画像はこんな感じ。





着色結果は以下の通り。





画像全体の雰囲気を変化させることも可能。





アニメ風にしたり、アート風にしたりできます。





以下の図は「Seedream 4.0」「Gemini 2.5(Nano Banana)」「GPT Image 1」「Seedream 3.0」「Qwen-Image」の画像生成ベンチマーク結果を比較したものです。Seedream 4.0はすべてのテストでNano Bananaを上回り、一部のテストではGPT Image 1を超えるスコアを示しています。





画像編集性能の比較は以下の通り。Seedream 4.0は多くのテストで最高スコアを記録しました。





Seedream 4.0はfalやComfyUIなどの複数のプラットフォームですでに利用可能となっています。また、ByteDanceによるプロンプトガイドが以下のリンク先で公開されています。



Seedream 4.0 User Guide - Feishu Docs

https://bytedance.larkoffice.com/docx/PBvldM6Xlo5OHKxsRNVcyAq4nFe

