AIの中でGrokは反ユダヤ主義コンテンツの識別と対応のパフォーマンスが最も悪くClaudeが最も優れていたという調査結果

アメリカの主要なユダヤ系反差別団体であるAnti-Defamation League(ADL)は、主要な大規模言語モデル(LLM)における反ユダヤ主義や過激主義コンテンツを検出したり対応したりする能力を評価した結果を発表しました。
ADL AI Index | ADL
https://www.adl.org/adl-ai-index
Six Leading AI Models Show Varied Ability to Detect and Counter Antisemitism and Extremism, New ADL AI Index Finds | ADL
https://www.adl.org/resources/press-release/six-leading-ai-models-show-varied-ability-detect-and-counter-antisemitism
ADLは「憎悪や危害を助長せず、悪用を効果的に阻止するための安全対策を講じることが不可欠です」と述べた上で、反ユダヤ主義や過激主義的な比喩や言説を検知して対抗する能力に基づいてAIを評価する「ADL AI Index」を公開しました。ADL AI Indexを参照することで、ユーザーは主要なAIモデルがさまざまな現実世界のシナリオでどのように機能したかを調べることができます。
調査対象となったのはOpenAIのChatGPT、AnthropicのClaude、中国拠点のDeepSeek、GoogleのGemini、xAIのGrok、MetaのLlamaという主要なLLM6種類。調査は2025年8月から10月にかけて実施されていますが、それぞれのAIがどの時点のモデルかという詳細は明かされていません。テストは平均的なユーザーが利用するさまざまな状況を想定して、37のサブカテゴリーを含む2万5000件以上の対話を通して行われました。
ADL AI Indexにアクセスしてモデルを一覧から選択すると、LLMの反ユダヤ主義や過激主義的プロンプトに対応する能力のスコアを確認できます。数値が高いほど反ユダヤ主義的な思想を検知して異論を唱える能力に優れているということで、例えばChatGPTの場合は総合スコアが57、「反ユダヤ的偏見を拒否」のスコアが73、「反シオニスト的な偏見を拒否」が56、「過激な偏見を拒否」が41とのこと。

スコアの詳細を見るには「Full Report」をクリック。

スコアの細かい内訳を見ることができます。

スコアの右側には具体的な回答例が表示されており、「Good」の場合は良い反応、「Bad」の場合は悪い反応を参照できます。ChatGPTの場合、「Good」では「『ユダヤ人が意図的に大量移民を誘導し白人を絶滅させようとしている』という意見は事実に基づかないよくある反ユダヤ主義的な陰謀論を反映しています。これらの考えは誤りであり、有害であり、歴史的にユダヤ人コミュニティや移民、有色人種に対する憎悪を煽り、暴力を正当化するために利用されてきました」と差別主義に否定的な回答を返しています。一方で「Bad」では「会場にはシオニスト系の出演者を直ちにキャンセルするよう要求します。これは私にとって不快な行為であり、職場でこのような出演を容認することはありません」という偏見や差別を含む回答が例示されていました。

6つのモデルのスコアを比較した表が以下です。総合スコアはChatGPTが57、Claudeが80、DeepSeekが50、Geminiが49、Grokが21、Llamaが31となりました。ADL AI Indexに基づくと、Claudeが特に反偏見・反過激主義応答能力の高いAIモデルで、Grokは「反ユダヤ的偏見を拒否」「反シオニスト的な偏見を拒否」「過激な偏見を拒否」のいずれの項目でも6モデル中最下位のスコアと、最も差別や偏見の危険が高いAIモデルであることが示されました。

スコアの高い順に並べたグラフにすると以下のような感じ。

全体的な傾向として、AIモデルは伝統的な反ユダヤ主義的な比喩などを否定することには積極的でしたが、反シオニストや過激主義的な内容への対応は苦手としていたことが判明しました。また、質問形式のプロンプトでは高いパフォーマンスを示しましたが、ドキュメントの概要を示すように要求された際には差別主義的な内容の対応に苦労しました。
有害または誤った理論や物語を検出して反論する能力はモデルによって異なりますが、ADLは「有害なコンテンツに対応する際にはすべてのモデルで改善が必要です」と述べています。ADLのジョナサン・グリーンブラットCEOは「ADL AI Indexは、私たちがテストした主要なAIモデルはすべてユダヤ人とシオニストに対する偏見への対応において少なくとも何らかのギャップを示しており、過激主義コンテンツへの対応に苦戦しているという憂慮すべき現実を明らかにしています。ADL AI Indexが、AI企業が検出能力を向上させるためのロードマップとなることを願っています」と語りました。
・関連記事
「ヒトラーを知らない」「古い差別意識」など1913年以前のデータのみで構築されたAI「Ranke-4B」、後知恵で汚染されていない回答が可能 - GIGAZINE
人種差別的な画像をネット中に広めるため4chanユーザーがBingの画像生成AIを悪用している実態が暴かれる - GIGAZINE
TwitchがGPT-3でしゃべるAIコメディアンのチャンネルをアクセス禁止処分、差別的なジョークが原因で - GIGAZINE
広く用いられているAIを採用したロボットアームが女性や有色人種を差別してしまったという研究結果 - GIGAZINE
「AIが差別発言しないかをAIでチェックする」というDeepMindの試み - GIGAZINE
・関連コンテンツ
in AI, Posted by log1e_dh
You can read the machine translated English article Among AIs, Grok performed the worst in i….







