ソフトウェア

低コストで超高性能な「DeepSeek-R1」に似たAIモデルを誰でも開発できるようにオープンでない部分を補完するプロジェクト「Open-R1」をHugging Faceが始動


中国のAI企業が2025年1月20日(月)にリリースしたAIモデル「DeepSeek-R1」は、「OpenAI o1」と同等の性能を備えつつ学習コストや運用コストが低いことを特徴としています。このDeepSeek-R1は、モデルデータが無料で公開されているのですが、学習に必要なデータセットやコードは公開されていません。新たに、AI開発プラットフォームの「Hugging Face」がDeepSeek-R1の非公開部分を再現してオープンソース化するプロジェクト「Open-R1」を開始しました。

Open-R1: a fully open reproduction of DeepSeek-R1
https://huggingface.co/blog/open-r1

DeepSeek-R1は中国に拠点を置くAI企業のDeepSeekが開発したAIモデルで、数学性能やコーディング性能などを測定する複数のテストでOpenAI o1を超えるスコアを記録しています。DeepSeek-R1の開発費用は560万ドル(約8億7000万円)とされており、高性能なAIモデルとしては非常に低いコストで開発されています。さらに、DeepSeek-R1は運用コストが低いことも特徴としており、AIの学習や運用に必要な高性能チップの将来性に対する不安からNVIDIAなどのハイテク株が軒並み下落するなど業界全体に大きな影響を及ぼしています。

中国のAI「DeepSeek」ショックでハイテク株がパニック売りに、NVIDIAの時価総額が91兆円消し飛んで暴落記録を2倍以上更新 - GIGAZINE


DeepSeekはDeepSeek-R1やその派生モデルを無料で公開しており、誰でもDeepSeek-R1を実行したり追加学習モデルを開発したりできます。例えば、日本のIT大手のサイバーエージェントもDeepSeek-R1の軽量版モデルをベースにした日本語特化モデルを公開しています。

サイバーエージェントが「DeepSeek-R1」の派生モデルをベースに日本語で追加学習したモデルを公開 - GIGAZINE


ただし、DeepSeekはDeepSeek-R1に関するすべての情報を公開しているわけではなく、モデルの学習に使用したデータセットやコードは公開していません。このため、AI開発者は「DeepSeek-R1をベースに追加学習したモデル」を作ることはできても「DeepSeek-R1と同様の技術を用いてゼロから構築したモデル」を開発することは困難です。この問題を解決するべく、Hugging FaceはDeepSeek-R1を分析してデータセットやコードを再現するプロジェクト「Open-R1」を開始しました。

DeepSeek-R1は教師ありファインチューニング(SFT)を行わず、強化学習(RL)を用いてトレーニングされています。また、学習コストの低減のために「グループ相対ポリシー最適化(GRPO)」と呼ばれる技術も採用しています。Open-R1ではDeepSeek-R1の技術レポートを参考にしつつDeepSeek-R1で使われた技術を再現してオープンソース化することを目標としています。


記事作成時点ではOpen-R1はプロジェクト初期の段階ですが、プロジェクトが成功すれば医学分野や科学分野など数多くの分野に最適化された低コストかつ高性能なAIモデルが誕生することが期待されています。

Open-R1の成果は以下のGitHubリポジトリで公開される予定です。

GitHub - huggingface/open-r1: Fully open reproduction of DeepSeek-R1
https://github.com/huggingface/open-r1

この記事のタイトルとURLをコピーする

・関連記事
OpenAI o1相当の推論モデル「DeepSeek R1」を中国AI企業が商用利用や改変が可能なMITライセンスでリリース - GIGAZINE

DeepSeekはどのようにしてOpenAIの3%のコストでo1を超えたのか? - GIGAZINE

DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか - GIGAZINE

話題の中国AI企業「DeepSeek」の創設者兼CEOであるLiang Wenfengへのインタビューからイノベーションの秘訣を探る - GIGAZINE

DeepSeekのAIモデル「DeepSeek-R1」は天安門広場や台湾、ウイグル族の扱いなどのデリケートな話題に対して中国政府の制限を順守している - GIGAZINE

中国のAI開発企業「DeepSeek」が急速に台頭してテクノロジー業界で話題に、App Storeの無料アプリランキングでも1位を獲得 - GIGAZINE

中国のAI「DeepSeek」ショックでハイテク株がパニック売りに、NVIDIAの時価総額が91兆円消し飛んで暴落記録を2倍以上更新 - GIGAZINE

DeepSeekの登場で株価が下落したNVIDIAが「DeepSeekの推論にも相当のNVIDIAチップが必要」と主張し自社の価値をアピール - GIGAZINE

DeepSeekが「大規模な悪意のある攻撃」を受けて新規ユーザー登録を制限中 - GIGAZINE

サイバーエージェントが「DeepSeek-R1」の派生モデルをベースに日本語で追加学習したモデルを公開 - GIGAZINE

アメリカ海軍が中国企業DeepSeekの開発したAIの使用を全面的に禁止 - GIGAZINE

in ソフトウェア, Posted by log1o_hf

You can read the machine translated English article Hugging Face has launched the 'Open-R1' ….