ChatGPTやCodexが「ゴブリン」を連呼するようになった原因をOpenAIが解説、オタクっぽいしゃべり方の学習方法に問題があった

OpenAI製エージェントツール「Codex CLI」のソースコードには「ゴブリンやアライグマについて話すな」というAIへの指示文が含まれています。実際にユーザーからは「ChatGPTやCodexがゴブリンに言及する頻度が増加した」という報告が寄せられていたのですが、2026年4月29日にOpenAIが問題の発生原因を報告しました。
Where the goblins came from | OpenAI
https://openai.com/index/where-the-goblins-came-from/
以下のスクリーンショットはGoogleでAI製品などの開発に携わっているBarron Roth氏が投稿した「GPT-5.5との会話履歴を『goblin(ゴブリン)』というフレーズで検索した結果」です。ゴブリンとの関連性が低い話題にも関わらず、多様な文脈でゴブリンというフレーズを使っていることが分かります。

上記の状況に関連して、OpenAIがエージェントツールのCodex CLIに「ユーザーのクエリに絶対的かつ明白に関連する場合を除き、ゴブリン・グレムリン・アライグマ・トロール・オーガ・ハト・その他の動物やクリーチャーについて決して話してはいけません」という指示文を追加したことも明らかになっています。
OpenAIは「ゴブリンやアライグマについて話すな」とAIコーディングツールのCodexに指示している - GIGAZINE

OpenAIによると、「ゴブリン」や「グレムリン」といった空想上の生物への言及増加の兆候はGPT-5.1から現れ始めたとのこと。GPT-5 Thinkingが会話中にゴブリンに言及する割合は0.04%でしたが、GPT-5.1 Thinkingでは0.12%に急増しました。

その後、GPT-5.4ではゴブリンへの言及頻度が急増し、ユーザーからも指摘されるようになりました。これを受けてOpenAIが詳細を分析した結果、ChatGPTの性格を「Nerdy(オタクっぽい)」に設定しているときにゴブリンへの言及が増加することが判明しました。以下はGPT-5.4の性格ごとのゴブリン言及率を示しており、Nerdyが突出していることが分かります。OpenAIによるとChatGPTの返信全体に占めるNerdyでの返信割合は2.5%でしたが、ゴブリンを含む返信の66.7%がNerdyによるものだったそうです。

ChatGPTの性格は「○○っぽい返信をした際に報酬を与える」というルールで強化学習を実施することで形成されます。分析の結果、「オタクっぽい返信をした際に報酬を与える」という報酬シグナルに「ゴブリン」や「グレムリン」といったフレーズを好む傾向があることが判明。これにより、Nerdyではゴブリンなどへの言及が増加していたというわけです。
さらに、Nerdyの学習成果が他の性格にも影響を与えていることが判明しました。以下のグラフは左が「Nerdyを含む強化学習での『ゴブリン』および『グレムリン』への言及割合」、右が「Nerdyを除外した強化学習での『ゴブリン』および『グレムリン』への言及割合」を示しており、Nerdyを含めて学習するとAIモデル全体でゴブリンやグレムリンへの言及が増加することが分かります。

OpenAIは2026年3月中旬にNerdyを削除しました。以下のグラフは時期ごとのゴブリンおよびグレムリンへの言及割合を示しており、GPT-5.4ではNerdyを削除したことで言及割合が減少していることが分かります。しかし、GPT-5.5の学習はゴブリン問題の根本原因が判明するより前に始まっていたため、GPT-5.5の初期バージョンには問題の影響が残ってしまったそうです。そこで、OpenAIは問題を緩和するためにCodex CLIの指示文にゴブリンを禁止する指示文を追加したというわけです。

OpenAIは今回のゴブリン問題を通じて「モデルの奇妙な挙動を迅速に調査する方法」を構築できたとコメントしています。
・関連記事
OpenAIは「ゴブリンやアライグマについて話すな」とAIコーディングツールのCodexに指示している - GIGAZINE
OpenAIが「人間がAIのボトルネック」としてCodexエージェント自動管理ツール「Symphony」を開発、社内ではプルリク件数5倍の事例も - GIGAZINE
「OpenAIは新規ユーザー数と売上高に関する目標を達成できなかった」との指摘をOpenAIが「典型的な釣り記事」と一蹴 - GIGAZINE
OpenAIがMicrosoftとの独占契約を解消、Amazon BedrockからOpenAIのモデルを直接利用できるように - GIGAZINE
MicrosoftはCopilotを「娯楽目的のもので、重要な助言では頼らないこと」と警告している - GIGAZINE
・関連コンテンツ
in AI, Posted by log1o_hf
You can read the machine translated English article OpenAI explains why ChatGPT and Codex st….






