ソフトウェア

DeepSeekが画像生成モデル「Janus Pro」をMITライセンスで公開、DALL-E 3を超える性能と自負


中国のAIスタートアップであるDeepSeekが、独自の画像生成モデル「Janus Pro」を公開しました。Janus ProはOpenAIの画像生成AIであるDALL-E 3を上回る性能を持つとアピールされており、MITライセンスで公開されています。

Viral AI company DeepSeek releases new image model family | TechCrunch
https://techcrunch.com/2025/01/27/viral-ai-company-deepseek-releases-new-image-model-family/


DeepSeekがAI開発プラットフォームのHugging Faceで、画像生成モデルの「Janus Pro」を公開しました。Janus Proのパラメーターサイズは10億~70億で、パラメーターサイズの多いモデルがより優れたパフォーマンスを発揮します。Janus ProはMITライセンスに基づいて配布されており、商用利用も可能です。

deepseek-ai/Janus-Pro-1B · Hugging Face
https://huggingface.co/deepseek-ai/Janus-Pro-1B


DeepSeekはJanus-Proを「斬新な自己回帰フレームワーク」と表現しており、新しい画像を分析したり作成したりすることも可能です。DeepSeekは「Janus-Proは以前の統合モデルを凌駕し、タスク固有のモデルのパフォーマンスに匹敵するか、それを上回ります」「シンプルさ、高い柔軟性、有効性により、Janus-Proは次世代の統合マルチモーダルモデルの有力な候補となります」と説明しています。

以下のグラフはマルチモーダルAIモデルのパラメーターサイズと平均パフォーマンスを示したもの。Janus-Proの最もパラメーターサイズが大きなJanus-Pro-7Bは、パラメーターサイズが同等の競合モデルよりも優れたパフォーマンスを発揮しているのがよくわかります。


以下はAIベンチマークのGenEvalとDPG-Benchで、テキストから画像を生成した場合のパフォーマンスを比較したグラフ。Janus-Pro-7BはDALL-E 3、PixArt-alpha、Emu3-Gen、Stable Diffusion XLといった競合モデルよりも優れたパフォーマンスを発揮しているとのこと。


テクノロジーメディアのTechCrunchは「比較対象となったモデルの一部は古いバージョンであり、Janus-Proのほとんどのモデルは最大解像度384×384ピクセルの小さな画像しか分析できません。それでもJanus-Proの性能はモデルのコンパクトさを考慮すると印象的です」と記しています。

DeepSeekはクオンツトレーディング企業のHigh-Flyer Capital Managementから資金提供を受けており、App Storeの無料アプリランキングで1位となり、一般ユーザーの注目を集めるようになりました。DeepSeekの言語モデルは計算効率の高い技術を使用してトレーニングされているため、業界アナリストやエンジニアはアメリカがAI競争でリードを維持できるのか、AIチップの需要が持続するのか疑問視しています。

中国のAI開発企業「DeepSeek」が急速に台頭してテクノロジー業界で話題に、App Storeの無料アプリランキングでも1位を獲得 - GIGAZINE


Janus-ProはGitHub上でも公開されています。

GitHub - deepseek-ai/Janus: Janus-Series: Unified Multimodal Understanding and Generation Models
https://github.com/deepseek-ai/Janus

この記事のタイトルとURLをコピーする

・関連記事
DeepSeekのAIモデル「DeepSeek-R1」は天安門広場や台湾、ウイグル族の扱いなどのデリケートな話題に対して中国政府の制限を順守している - GIGAZINE

TikTokのByteDanceがAI「Doubao-1.5-pro」をリリース、OpenAIのモデルに匹敵する中国製AIが続々登場 - GIGAZINE

OpenAI o1相当の推論モデル「DeepSeek R1」を中国AI企業が商用利用や改変が可能なMITライセンスでリリース - GIGAZINE

中国のAI企業DeepSeekがOpenAI o1に匹敵する推論AIモデル「DeepSeek-R1-Lite-Preview」公開、オープンソース化する計画も - GIGAZINE

in ソフトウェア, Posted by logu_ii

You can read the machine translated English article DeepSeek releases image generation model….