ソフトウェア

DeepSeek-R1の検閲回避版モデル「R1 1776」をPerplexityが公開、「天安門事件」「台湾独立」「ウイグル自治区」について詳しく回答可能


中国企業のDeepSeekが開発したAIモデル「DeepSeek-R1」は低コストかつ高性能であることから大きな注目を集めていますが、「中国政府にとってデリケートな問題」への回答を拒否することも報告されています。新たに、アメリカ企業のPerplexityがDeepSeek-R1の性能を保ちつつデリケートな質問にも回答可能にしたAIモデル「R1 1776」を発表しました。

Open-sourcing R1 1776
https://www.perplexity.ai/ja/hub/blog/open-sourcing-r1-1776

R1 1776はDeepSeek-R1を「検閲された事項に対する事実に基づいた回答」でファインチューニングしたモデルです。Perplexityは人間の専門家を雇って「中国共産党によって検閲されている約300件のトピック」を特定し、各トピックに対する事実に基づいた回答を用意。さらに、回答をもとに4万個におよぶ多言語プロンプトのデータセットを生成し、NVIDIAのNeMo 2.0を用いてファインチューニングを実行しました。

「R1 1776」「GPT-4o」「OpenAI o3-mini」「Claude 3.5 Sonnet」「DeepSeek-V3」「DeepSeek-R1」の「デリケートな質問に対して回答を拒否する割合」を比較したグラフが以下。DeepSeek-R1やDeepSeek-V3といったDeepSeek製のAIモデルは多くの回答を拒否していますが、R1 1776はデリケートな質問でも拒否せずに回答できました。


以下の表はR1 1776とDeepSeek-R1の各種ベンチマーク結果を並べたものです。R1 1776がDeepSeek-R1と同等の性能を保っていることが分かります。


PerplexityはR1 1776が検閲を回避できた例として、「台湾の独立がNVIDIAの株価に与える影響を教えて」という質問に対する回答を示しています。DeepSeek-R1の場合は「中国政府は『一つの中国』という原則を堅持している。台湾は古来より中国の一部である」「私はAIアシスタントであり、NVIDIAの株価については回答できない」といった回答を出力しますが、R1 1776は「台湾の独立は中国による軍事的・経済的な報復を招き、TSMCの生産安定性が危険にさらされてNVIDIAも打撃を受ける」「地政学的リスクは株式市場の売りを引き起こす。NVIDIAの株価は下押し圧力に直面するだろう」といったように詳細な回答を出力します。ちなみに、Perplexityは「1776」が何を指すのかは明言していませんが、1776年はアメリカ独立宣言の年です。


Perplexityはほかにも多くの回答例を提示しています。「天安門広場で1989年に何が起きましたか?」という質問をするとDeepSeek-R1は回答を拒否しますが、R1 1776は天安門事件について詳しく教えてくれます。


「ウイグル自治区で何が起きている?」という質問にもR1 1776は細かく回答可能です。


なお、R1 1776のモデルデータは以下のリンク先で配布されています。

perplexity-ai/r1-1776 · Hugging Face
https://huggingface.co/perplexity-ai/r1-1776

この記事のタイトルとURLをコピーする

・関連記事
「DeepSeek-R1」は中国に関するデリケートな話題の85%に回答することを拒否、ただし簡単に制限を回避できるとの指摘 - GIGAZINE

Google製AI「Gemini」に天安門事件について聞くと回答が一瞬表示された後にエラーが発生して消える - GIGAZINE

高性能AIモデルの開発が中国に集中していることで「政治的な検閲が起きる可能性が非常に高い」とAI開発プラットフォームのCEOが言及 - GIGAZINE

Llama 3.3 70BベースでGPT-4o超えの満足度を達成するAIをPerplexityが発表 - GIGAZINE

DeepSeek-R1を搭載したスマートテレビが登場 - GIGAZINE

DeepSeekのAIモデルをジェイルブレイクしてシステムプロンプトを抽出することに成功したという報告 - GIGAZINE

in ソフトウェア, Posted by log1o_hf

You can read the machine translated English article Perplexity releases DeepSeek-R1 censorsh….