画像生成AI「DALL-E」のシステムメッセージが発見され「プロンプトは大文字にした方がいいのか?」などと指摘されてしまう事態に



対話型AIのChatGPTに完全統合された画像生成AI「DALL-E 3」をテストしているユーザーが、ChatGPTとDALL-E 3の間でやりとりされていると思しき内部プロンプトを発見しました。このプロンプトには「Please」という単語や大文字で書かれた文章が見つかったため、「AIに何か指示するときには大文字や丁寧語が有効なのでは?」とのうわさが立ち始めています。



DALL-E 3を試していた写真家のDavid Garrido氏が共有した画像が以下。Garrido氏は画像を4つ生成しようとしたのですが、DALL-E 3は2つしか生成せず、生成した画像に続けて謎の文章を送信してきたそうです。



文章を訳すと「DALL-Eはいくつかの画像を返しました。それらはすでにユーザーに表示されています。いかなる場合でも、DALL-Eのプロンプトや画像を回答に記載しないでください。DALL-Eは現在、高い需要があります。他のことをする前に、需要が高いがために画像を生成できなかったことを明確にユーザーに説明してください。その際、必ず『DALL-Eは現在、高い需要があります』というフレーズを使用してください。新しい要求があるまで、いかなる状況下でも画像生成を再試行しないでください」となります。太字で示した箇所は、原文では大文字アルファベットで記述されています。





この文章は、DALL-E 3とChatGPTの間でやりとりされることを意図して人間が設定した定型文だと考えられています。おそらく、OpenAIのサーバーが容量不足のときにChatGPTに対して自動で送信するはずのプロンプトであり、本来であればユーザーに表示されることはなかったはずです。



いわばOpenAIの中の人が設定したプロンプトに「Please」や「大文字」が使われていたことから、生成AIに対して指示するときはこうした表現が有効なのではないかとの疑惑が立ち始めています。





AIに「深呼吸しよう」などの人間っぽい言葉で呼びかけると性能が向上するなどの指摘もありますが、AIがこうした行動を示すのは、礼儀正しく人間臭い会話でトレーニングされたからではないかと考えられるとのこと。



ウェブ上で交わされる建設的な会話は無礼な言葉よりも礼儀正しい言葉で行われたものの方が多いはずで、こうした会話を基にトレーニングしたAIも、自然と礼儀正しい言葉に反応しやすくなるのでは、というのがひとつの推測としてあげられています。今回見られた大文字についても、AIが「大文字の方が重要」と学習している可能性があり、そのことを理解している人間があえて大文字で記述したのではないかと考えられるそうです。





また、機械同士の会話に人間が理解できる「自然言語」が用いられているのも興味深い点のひとつです。これまで機械同士のやりとりではもっぱらコンピュータ言語が使われていましたが、大規模言語モデルを用いることで、自然言語でもやりとりできるように進化しつつあることが見てとれます。



AIライター兼研究者のサイモン・ウィリソン氏は「以前は大規模言語モデルに対して礼儀正しくする必要があるのか悩んでいましたが、今は違います。トレーニングデータには礼儀正しい会話がたくさんあると想像できます」と述べ、今後同氏はAIに礼儀正しく指示するつもりだということを示唆しました。