ソフトウェア

画像生成AI「Midjourney V5」登場、超高画質&AIが苦手な「手」もキレイで実写との区別はほぼ不可能


画像生成AI「Midjourney」の開発チームが、2023年3月16日(木)に「Midjourney V5」のアルファ版をリリースしました。「Midjourney V5」では超高画質な画像生成が可能となっているだけでなく、画像生成AIの課題であった「『手』を正確に描写できない問題」が解決されたという報告も寄せられています。

Starting today our community can test Midjourney V5. It has much higher image quality, more diverse outputs, wider stylistic range, support for seamless textures, wider aspect ratios, better image prompting, wider dynamic range and more. Let’s explore!

— Midjourney (@midjourney)


開発チームによると、「Midjourney V5」では「プロンプトに対する反応の向上」「出力画像の解像度が2倍に」「プロンプトに含まれるテキストの量を減らしても詳細な画像を出力可能」「2:1を超える幅広画像に対応」といった機能改善が実施されているとのこと。


既に、インターネット上には「Midjourney V5」を用いて生成した画像が多数公開されています。

「Midjourney V5」で生成した「異なるアングルから撮影した2枚のポートレートを横に並べた画像」が以下。「同一人物の顔を別のアングルから描写」という複雑なタスクを問題なくこなせています。

midjourney tip: v5 is impressive at doing split images with different angles of a person!

→ find the prompt in the ALT text of the images #synthography #midjourneyv5 pic.twitter.com/qaR7I2G27d

— Julie W. Design (@juliewdesign_)


「Midjourney」や「Stable Diffusion」などの画像生成AIには「『手』を正確に描写するのが難しい」という問題が存在しています。しかし、「Midjourney V5」で生成された以下の画像では、手が正確に描写されています。

Just a heads-up - Midjourney's AI can now do hands correctly. Be extra critical of any political imagery (especially photography) you see online that is trying to incite a reaction. pic.twitter.com/ebEagrQAQq

— Del Walker (@TheCartelDel)


「Midjourney V5」で生成された実写風画像たち。人間の顔や手、背景のボケ具合などが非常に自然で、言われなければAI生成画像と気付けない出来栄えです。

the lighting and skin texture feels illegal in #midjourneyv5

the littlest amount of #photoshop is still in there, but nothing compared to what I usually do ???? #synthography aka #aiphotography, now is on the next level!

and MJ used to suck at window reflections; look at her now pic.twitter.com/ezr3ewyZgy

— Julie W. Design (@juliewdesign_)


「Midjourney V4」(左)と「Midjourney V5」(右)に同じプロンプトを入力して生成した画像。見比べると、「Midjourney V5」の方が服装や視線の不自然さが少なくなっています。

street style photo of a young woman, red gucci jacket, blue gucci shirt, wide shot, natural lighting, soho, shot on Agfa Vista 200, 4k --ar 16:9

v4 (left) v5 (right) pic.twitter.com/I80Bd0EEyP

— Nick St. Pierre (@nickfloats)


上記のように「Midjourney V5」では非常に美麗な画像を生成できますが、弱点も存在しています。例えば、以下の画像は一見すると実写風に見えますが、よく観察すると「画像左側の陳列物がガラスケースを貫通している」「看板に判読不能な謎言語が記されている」といった非現実的な部分もあることが分かります。

street style photo of a busy new york city bodega filled with people standing by the deli counter --ar 16:9 pic.twitter.com/V0PASDAdnv

— Nick St. Pierre (@nickfloats)


「Midjourney V5」は、記事作成時点ではテスト段階とのこと。Midjourney関連の最新情報は、以下のDiscordサーバーで公開されています。

Midjourney | Discord
https://discord.com/invite/midjourney

この記事のタイトルとURLをコピーする

・関連記事
画像生成AI「Midjourney」のバージョン4が公開される、美麗な画像の生成が簡単過ぎて呪文の達人が嘆くほど - GIGAZINE

画像生成AI「Midjourney」をアニメ風二次元イラストに特化させたモデル「niji・journey(にじジャーニー)」がクローズドベータテスターを一般募集中 - GIGAZINE

画像生成AI「Midjourney」をオープンソースで再現する「OpenJourney」が登場 - GIGAZINE

画像生成AI「Midjourney」はポルノ&グロ画像対策で生殖関連の単語を幅広くNGにしている - GIGAZINE

in ソフトウェア,   アート, Posted by log1o_hf

You can read the machine translated English article here.