AI

OpenAIが画像生成モデル「GPT Image 1.5」を搭載した「ChatGPT Images」を公開、画像生成が最大4倍高速化でGoogleのNano Banana Proに対抗


OpenAIは2025年12月17日に、新しい画像生成モデル「GPT Image 1.5」を搭載した新バージョンの「ChatGPT Images」をリリースしました。この新モデルは、ゼロからの画像生成だけでなく、既存の写真の編集においてもユーザーの意図をより確実に反映できるよう設計されています。

The new ChatGPT Images is here | OpenAI
https://openai.com/index/new-chatgpt-images-is-here/

OpenAI’s new flagship image generator AI is here | The Verge
https://www.theverge.com/ai-artificial-intelligence/845558/openais-new-flagship-image-generation-model-gpt-image-1-5

GPT Image 1.5は照明や構図、人物の外見といった要素を一貫して保ちながら、要素の追加、削除、結合、ブレンドといった精密な編集を行うことができ、元の画像の良さを損なわずに変更を加えることが可能です。また、画像の生成速度は最大で4倍高速化しました。

以下は、OpenAIのサム・アルトマンCEOの写真を読み込ませて、「1980年代の象徴的なVHSフィットネスインストラクターに変身させてください」というプロンプトを、細かい指示と共に入力した結果。80年代VHSを思わせる画質がしっかりと再現されており、「LET'S GET PHYSICAL」というテロップに破綻はありません。


フェルメール「真珠の耳飾りの少女」とミックスした画像が以下。


エナメル製のクリスマスの飾りにするとこんな感じ。プロンプトに忠実で、証明や構図が自然で、大きな破綻は見られません。


「6×6グリッドを描いて、そのマス目の中に指示した通りのイラストを描いて」という指示を、GPT Image 1.5(左)と前モデル(右)に与えた結果が以下。最初の6×6グリッドを描くという指示から、GPT Image 1.5の方がより正確であることがわかります。OpenAIは「要素間の関係性が意図通り維持され、より正確な編集とより複雑なオリジナル構成が可能になります」と述べています。


また、テキストレンダリング能力が強化され、より高密度で小さなテキストやMarkdownを正確に描写できるようになっています。以下は、新聞記事風にGPT-5.2の特徴やベンチマーク結果をまとめた画像をGPT Image 1.5に生成させたもの。従来の画像生成AIでは、画像の中に描かれる文字は形が破綻して文字ではなくなってしまうことがよくありますが、GPT Image 1.5が生成した画像には細かい文字が正確に書かれています。


さらに、多数の小さな顔の描写や全体的な自然さも改善されていますが、深海生物のポスターなどの例で明確な改善が見られる一方で、特定のスタイルや複数の顔の生成など一部の領域では依然として完璧ではなく、今後の改善の余地があるとOpenAIは述べています。

ビジネスおよび開発者向けには、APIにおいて「GPT Image 1.5」として提供され、入力および出力のコストが前モデルのGPT Image 1と比較して20%安くなりました。このモデルはブランドのロゴや製品の一貫性を保つ能力に長けているため、マーケティング資料や商品カタログ作成に適しており、すでにWixやCanvaなどの企業によって利用されているとのこと。


ChatGPT Imagesは現在、ChatGPTのすべてのユーザーおよびAPIユーザー向けに展開されていますが、ビジネスおよびエンタープライズ向けのアクセスについては後日提供される予定です。

また、ChatGPTではメッセージに表示したい内容を記述して画像を生成する機能に加えて、画像専用のホームが導入されました。画像専用のホームでは、数十種類のプリセットフィルターとプロンプトが用意されているほか、画像生成用のプロンプトのヒントも提示されます。


IT系ニュースサイトのThe Vergeは、OpenAIはこの新モデルを単なる目新しさの追求ではなく、実用的で高精細なビジュアル作成ツールへのシフトと位置づけており、ChatGPTを「ポケットの中のクリエイティブスタジオ」にすることを目指していると指摘。Googleの画像生成AI「Nano Banana」シリーズのヒットなどで画像生成AIの競争が激化する中、投資家からの収益化圧力に応えるために、特に企業向けの実用性をアピールする狙いがあると見られます。

この記事のタイトルとURLをコピーする

・関連記事
Googleの画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」は過去モデルや他社製モデルと比べてどれくらい優秀なのか? - GIGAZINE

OpenAIのサム・アルトマンCEOが「コード・レッド」宣言、Geminiの好調を受けてChatGPT改善を優先し広告は後回し - GIGAZINE

OpenAIが「GPT-5.2」を緊急事態「コードレッド」発令からわずか1カ月足らずでリリース、猛追するGoogleへ反撃となるか - GIGAZINE

ディズニーがOpenAIに1600億円の投資、SoraやChatGPTでディズニーキャラクターの生成が可能に - GIGAZINE

Gemini 3 Proは文書・空間・画面・動画理解で最先端パフォーマンスを実現 - GIGAZINE

Googleが「Gemini 3 Deep Think」をリリース、Gemini 3 ProやGPT-5 Proを大きく上回る性能 - GIGAZINE

in AI,   ネットサービス,   デザイン, Posted by log1i_yk

You can read the machine translated English article OpenAI releases 'ChatGPT Images' with th….