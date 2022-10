テキストプロンプトで画像を編集できるAI技術がよく話題になっていますが、それらは編集タイプが限定されていたり、複数の画像の入力が必要だったりするものがほとんどです。しかし、2022年10月17日にプレプリントサーバーのarXivで発表された「 Imagic 」は、画像の修正箇所を手動で指示したり別の画像を入力したりしなくても、1枚の画像とテキストプロンプトだけで複雑な画像の編集が可能とのことで、論文に掲載されている画像を見るだけでもそのすさまじさを実感することができます。 [2210.09276] Imagic: Text-Based Real Image Editing with Diffusion Models https://arxiv.org/abs/2210.09276 「Imagic」は、事前にトレーニングしたText to Image拡散モデルを利用しているため、複雑な非剛体(形が変わる物体)の編集が可能です。例えば、以下のように元となった鳥の画像(左)と「翼を広げる鳥」という指示で飛び立とうとしている鳥の画像(右)を出力できます。

・関連記事

画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ - GIGAZINE



画像生成AI「Stable Diffusion」をGoogle Colaboratoryで動かして画像の保存先をGoogleドライブにする方法 - GIGAZINE



画像生成AI「Stable Diffusion」がTensorFlowとKerasCVで約30%高速になることが判明 - GIGAZINE



画像生成AI「Stable Diffusion」の18禁セーフティフィルターを解除する方法 - GIGAZINE



画像生成AI「Stable Diffusion」でどれぐらいプロンプト・呪文の指示に従うかを決める「CFG(classifier-free guidance)」とは一体何なのか? - GIGAZINE

2022年10月28日 19時00分00秒 in ソフトウェア, Posted by log1l_ks

You can read the machine translated English article here.