ハードウェア

CPU・GPU・TPUをワンチップで担う「Tachyum Prodigy」のCPUスペックが明らかに、最大クロック周波数5.7GHz・128コア・TDP 950Wのモンスタースペック


半導体企業のTachyumが、CPU・GPU・TPUの機能を単一のアーキテクチャに統合したチップ「Prodigy」を発表しました。ProdigyのCPUスペックは最大128コア、動作周波数は5.7GHz、16チャネルDDR5メモリ、TDPは950Wとなっており、テクノロジーメディアのWccftechは「非常識なスペック」と評しています。

Tachyum's Prodigy CPU Specs Unveiled: 5nm Universal Processors With Up To 128 Cores, 5.7 GHz Clocks, 16-Channel DDR5-7200 Memory Support & 950W TDP
https://wccftech.com/tachyums-prodigy-cpu-specs-unveiled-5nm-universal-processors-up-to-128-cores-5-7-ghz-16-channel-ddr5-7200-memory-950w-tdp/

ProdigyはCPU・GPU・TPUのタスクを同一のチップ上で実行可能なユニバーサルプロセッサです。すべてのタスクを同一のチップ上で実行できるため、競合製品よりもコストを節約することが可能でありながら、高性能という特徴を有しています。TachyumはProdigyを発表したプレゼンテーションの中で、「ProdigyはHPC面ではIntelのXeon CPUの4倍のパフォーマンスを発揮し、NVIDIAのH100に対してはHPC面で3倍、AI&推論ワークロード面では6倍のパフォーマンスを実現します」とそのハイパフォーマンスぶりをアピールしていました。また、競合他社のシステムと比較すると同じ電力で10倍以上のパフォーマンスを実現可能ともアピールしています。

Prodigyの特徴的なスペックは以下の通り。

・最大5.7GHzで動作する高性能ユニファイド64ビットコアを最大128個搭載
・16チャネルのDDR5メモリコントローラー
・PCIe 5.0が64レーン
・4ソケットおよび2ソケットのマルチプロセッササポート
・空冷式と液冷式の両方をサポートしたデータセンター向けラックソリューション
SPEC CPU2017の整数演算パフォーマンスはIntel Xeon Platinum 8380の約4倍で、AMD EPYC 7763 HPCの約3倍
・倍精度浮動小数点数パフォーマンスはNVIDIA H100の約3倍
・AIFP8のパフォーマンスはNVIDIA H100の約6倍


Prodigyの各モデルのスペックは以下の通り。

 コア数クロック周波数メモリPCIeTDP市場セグメント
T16128-AIX1285.7GHz16x DDR5-7200Gen5 x64950WハイエンドAI/HPC
T16128AIM1284.5GHz16x DDR5-7200Gen5 x64700WミドルレンジAI/HPC
T16128-AIE1284.0GHz16x DDR5-7200Gen5 x64600WエントリーAI/HPC
T16128-HT1284.5GHz16x DDR5-6400Gen5 x64300Wスループット
T864-HS645.7GHz8x DDR5-6400Gen5 x32300Wスピード
T864-HT644.5GHz8x DDR5-6400Gen5 x32300W効率
T832-HS325.7GHz8x DDR5-6400Gen5 x32300Wエントリー
T832-LP323.2GHz8x DDR5-4800Gen5 x32180W低電力


Prodigyは2つあるいは4つのマルチソケットをサポートしているため、4つのT16128-AIXからなる最大512コア・TDP 3800Wのシステムを構築することも可能。なお、ProdigyはすべてTSMCの5nmプロセスノードで製造され、命令セットアーキテクチャはネイティブおよびx86ARMアーキテクチャRISC-Vに対応。

HPCおよびAI関連の固有の機能としては以下が挙げられています。

・コアあたり2x1024ビットベクトル単位
・コアあたり4096ビットのマトリックスプロセッサ
・FP64、FP32、TF32、BF16、Int8、FP8、TAIデータ型
・スパースデータ型は効率を最適化
・低精度数値型を使用した量子化のサポート
・行列を効率的に保存・ロードするためのスキャッター/ギャザー

TachyumはProdigy専用の空冷ラックや液冷ラックを用意しており、NVIDIAのH100 DGX PODを使用した場合のT16128-AIXの倍精度浮動小数点数(FP64)性能が約90T(テラ)FLOPSであるのに対して、専用空冷ラックなら最大6.2P(ペタ)FLOPS、液冷ラックなら最大12.9PFLOPSまでパフォーマンスを向上させることが可能です。


なお、Prodigyは2022年下半期にリリース予定となっており、さらに次世代モデルとなる「Prodigy 2」が2024年下半期に登場予定です。Prodigy 2について、Tachyumは「製造プロセス3nmで、より多くのコア・メモリ・メモリ帯域幅を持ち、PCIe 6.0およびCXLに対応する」としています。

この記事のタイトルとURLをコピーする

・関連記事
Appleの次世代Mac向けチップ「M2」はゲームチェンジャーになりうるのか? - GIGAZINE

AppleがM1チップの次世代版となる「M2」を発表、第2世代5nmテクノロジーでトランジスタ数は200億に到達 - GIGAZINE

Intelが第12世代Intel Core HXプロセッサを発表、ノートPC向けのモバイルプロセッサとしては「世界最高のパフォーマンス」 - GIGAZINE

Intelが「世界最速のモバイルプロセッサ」としてモバイル向け第12世代Coreプロセッサを発表 - GIGAZINE

GoogleがAIを用いてAI専用プロセッサの開発を爆速化したことを発表 - GIGAZINE

in ハードウェア, Posted by logu_ii

You can read the machine translated English article The CPU specs of 'Tachyum Prodigy', whic….