NVIDIAのBlackwell Ultra(GB300 NVL72)はH200の50倍高速にAI処理が可能でコストは35分の1に削減

NVIDIAの高性能GPUはAIの開発および製品展開のために欠かせない存在となっています。そんなNVIDIA製GPUの中でも記事作成時点で最先端製品のGB300 NVL72について、「H200と比べて処理性能が50倍に向上しコストは35分の1になった」とアピールする記事がNVIDIA公式ブログに掲載されました。
New Data Shows NVIDIA Blackwell Ultra Delivers up to 50x Better Performance and 35x Lower Costs for Agentic AI | NVIDIA Blog
https://blogs.nvidia.com/blog/data-blackwell-ultra-performance-lower-cost-agentic-ai/?linkId=100000408009989
GB300 NVL72はAIファクトリー向けラックとして販売されているAI処理システムで、72個のNVIDIA Blackwell Ultra GPUと36個のNVIDIA Grace CPUを搭載しています。すでにMicrosoftやCoreWeaveといったAIクラウド企業が導入を進めており、長大なコンテキストを扱うエージェントコーディングなどのタスクで活用されています。

GB300 NVL72は前世代モデルのGB200 NVL72で蓄積されたカーネル最適化などの成果を継承しており、コンピューティング能力を最大限に発揮することができます。性能の高さとコストの低さを両立しているのも特徴で、GB200 NVL72より低いコストで処理を実行できます。

GB300 NVL72はFP4に量子化したモデルを実行できるのも特徴で、FP4に対応していないHopper世代のGPUと比べて各段に高速な処理が可能です。H200でDeepSeek-R1のFP8版を実行するシナリオとGB300 NVL72でDeepSeek-R1のNVFP4版を実行するシナリオを比較すると、GB300 NVL72は50倍多くのトークンを処理可能です。

さらに、H200と比べてコストを35分の1に抑えることができます。

NVIDIAは次世代アーキテクチャの「Rubin」を採用したGPUを2026年後半に出荷開始予定です。Rubin世代のGPUはBlackwell世代のGPUと比べて100メガワット当たりのスループットが最大10倍に向上し、100万トークン当たりのコストは10分の1に削減できるとのこと。さらに、Blackwell世代のGPUと比較してMoEモデルの学習に必要なGPUの数が4分の1に減ることもアピールされています。
・関連記事
NVIDIAがAI特化の次世代GPUアーキテクチャ「Blackwell Ultra」「Vera Rubin」「Rubin Ultra」を発表、RubinはHopperの900倍の性能でコストはわずか3% - GIGAZINE
NVIDIAの業務用GPUとAIチップを搭載した激安AIサーバーを入手して家庭用AIマシンを作ってしまった記録が話題に - GIGAZINE
NVIDIAが「DLSS 4.5」を発表、ゲームのフレームレートを大幅向上させる6倍フレーム生成モードも新登場 - GIGAZINE
Samsungが高速メモリ「HBM4」のNVIDIAへの供給に向けて最終調整段階に入り2026年2月の量産開始を目指す - GIGAZINE
NVIDIAのCEOがTSMCに「先進チップの未来は台湾にある」とメッセージ - GIGAZINE
・関連コンテンツ
in AI, ハードウェア, Posted by log1o_hf
You can read the machine translated English article NVIDIA's Blackwell Ultra (GB300 NVL7….







