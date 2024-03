Stable DiffusionやDALL-E 3などの画像生成AIを使っていると「文字の代わりに謎の模様が出力される」「短い単語なのにスペルが違う」といった問題に遭遇しがちです。画像生成AIが「文字の出力」を苦手とする理由について、ソーシャルニュースサイトのHacker Newsで激論が交わされています。 Ask HN: Why can't image generation models spell? | Hacker News https://news.ycombinator.com/item?id=39727376 画像生成AIで文字を含む画像を生成する例が以下。DALL-E 3を搭載した「 Image Creator 」で「『ラーメンファンタジー』という店名が記されたラーメン屋の外観写真」というプロンプトで画像を生成した結果、「ラーメンファンタジー」という語句は出力されず、「RAIMEN」という誤ったスペルの単語や謎の漢字風模様が出力されました。

2024年03月24日 21時00分00秒 in ソフトウェア, Posted by log1o_hf

