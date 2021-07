ベクトル量子化 (VQ)を用いた VAE である「 VQ-VAE 」を、 敵対的生成ネットワーク (GAN)に発展させた新しい画像生成モデルが「 VQGAN 」です。このVQGANと、テキストと画像という異なるデータを結びつけるニューラルネットワークの「 CLIP 」を組み合わせることで、「入力したテキストから画像を生成するモデル」を ライアン・モールトン さんが作成しています。 Tour of the Sacred Library – Ryan Moulton's Articles https://moultano.wordpress.com/2021/07/20/tour-of-the-sacred-library/ モールトンさんは、画像生成モデルの「VQGAN」と、画像とテキストを結びつけるニューラルネットワークの「CLIP」を組み合わせ、「入力したテキストから画像を生成するモデル」を作成しました。 このモデルを用いて、架空の島を舞台とした探検記である「 ダイノトピア 」で知られるイラストレーターの ジェームス・ガーニー さんの名前を利用して、「ジェームス・ガーニーの聖なる図書館の大広間」と入力して生成されたのが以下の画像。

2021年07月26日 19時00分00秒 in メモ, Posted by logu_ii

You can read the machine translated English article here.