CPU・GPU・TPUをワンチップで担う「Tachyum Prodigy」のCPUスペックが明らかに、最大クロック周波数5.7GHz・128コア・TDP 950Wのモンスタースペック
半導体企業のTachyumが、CPU・GPU・TPUの機能を単一のアーキテクチャに統合したチップ「Prodigy」を発表しました。ProdigyのCPUスペックは最大128コア、動作周波数は5.7GHz、16チャネルDDR5メモリ、TDPは950Wとなっており、テクノロジーメディアのWccftechは「非常識なスペック」と評しています。
Tachyum's Prodigy CPU Specs Unveiled: 5nm Universal Processors With Up To 128 Cores, 5.7 GHz Clocks, 16-Channel DDR5-7200 Memory Support & 950W TDP
https://wccftech.com/tachyums-prodigy-cpu-specs-unveiled-5nm-universal-processors-up-to-128-cores-5-7-ghz-16-channel-ddr5-7200-memory-950w-tdp/
ProdigyはCPU・GPU・TPUのタスクを同一のチップ上で実行可能なユニバーサルプロセッサです。すべてのタスクを同一のチップ上で実行できるため、競合製品よりもコストを節約することが可能でありながら、高性能という特徴を有しています。TachyumはProdigyを発表したプレゼンテーションの中で、「ProdigyはHPC面ではIntelのXeon CPUの4倍のパフォーマンスを発揮し、NVIDIAのH100に対してはHPC面で3倍、AI&推論ワークロード面では6倍のパフォーマンスを実現します」とそのハイパフォーマンスぶりをアピールしていました。また、競合他社のシステムと比較すると同じ電力で10倍以上のパフォーマンスを実現可能ともアピールしています。
Prodigyの特徴的なスペックは以下の通り。
・最大5.7GHzで動作する高性能ユニファイド64ビットコアを最大128個搭載
・16チャネルのDDR5メモリコントローラー
・PCIe 5.0が64レーン
・4ソケットおよび2ソケットのマルチプロセッササポート
・空冷式と液冷式の両方をサポートしたデータセンター向けラックソリューション
・SPEC CPU2017の整数演算パフォーマンスはIntel Xeon Platinum 8380の約4倍で、AMD EPYC 7763 HPCの約3倍
・倍精度浮動小数点数パフォーマンスはNVIDIA H100の約3倍
・AIFP8のパフォーマンスはNVIDIA H100の約6倍
Prodigyの各モデルのスペックは以下の通り。
コア数 | クロック周波数 | メモリ | PCIe | TDP | 市場セグメント | |
---|---|---|---|---|---|---|
T16128-AIX | 128 | 5.7GHz | 16x DDR5-7200 | Gen5 x64 | 950W | ハイエンドAI/HPC |
T16128AIM | 128 | 4.5GHz | 16x DDR5-7200 | Gen5 x64 | 700W | ミドルレンジAI/HPC |
T16128-AIE | 128 | 4.0GHz | 16x DDR5-7200 | Gen5 x64 | 600W | エントリーAI/HPC |
T16128-HT | 128 | 4.5GHz | 16x DDR5-6400 | Gen5 x64 | 300W | スループット |
T864-HS | 64 | 5.7GHz | 8x DDR5-6400 | Gen5 x32 | 300W | スピード |
T864-HT | 64 | 4.5GHz | 8x DDR5-6400 | Gen5 x32 | 300W | 効率 |
T832-HS | 32 | 5.7GHz | 8x DDR5-6400 | Gen5 x32 | 300W | エントリー |
T832-LP | 32 | 3.2GHz | 8x DDR5-4800 | Gen5 x32 | 180W | 低電力 |
Prodigyは2つあるいは4つのマルチソケットをサポートしているため、4つのT16128-AIXからなる最大512コア・TDP 3800Wのシステムを構築することも可能。なお、ProdigyはすべてTSMCの5nmプロセスノードで製造され、命令セットアーキテクチャはネイティブおよびx86・ARMアーキテクチャ・RISC-Vに対応。
HPCおよびAI関連の固有の機能としては以下が挙げられています。
・コアあたり2x1024ビットベクトル単位
・コアあたり4096ビットのマトリックスプロセッサ
・FP64、FP32、TF32、BF16、Int8、FP8、TAIデータ型
・スパースデータ型は効率を最適化
・低精度数値型を使用した量子化のサポート
・行列を効率的に保存・ロードするためのスキャッター/ギャザー
TachyumはProdigy専用の空冷ラックや液冷ラックを用意しており、NVIDIAのH100 DGX PODを使用した場合のT16128-AIXの倍精度浮動小数点数(FP64)性能が約90T(テラ)FLOPSであるのに対して、専用空冷ラックなら最大6.2P(ペタ)FLOPS、液冷ラックなら最大12.9PFLOPSまでパフォーマンスを向上させることが可能です。
なお、Prodigyは2022年下半期にリリース予定となっており、さらに次世代モデルとなる「Prodigy 2」が2024年下半期に登場予定です。Prodigy 2について、Tachyumは「製造プロセス3nmで、より多くのコア・メモリ・メモリ帯域幅を持ち、PCIe 6.0およびCXLに対応する」としています。
・関連記事
Appleの次世代Mac向けチップ「M2」はゲームチェンジャーになりうるのか? - GIGAZINE
AppleがM1チップの次世代版となる「M2」を発表、第2世代5nmテクノロジーでトランジスタ数は200億に到達 - GIGAZINE
Intelが第12世代Intel Core HXプロセッサを発表、ノートPC向けのモバイルプロセッサとしては「世界最高のパフォーマンス」 - GIGAZINE
Intelが「世界最速のモバイルプロセッサ」としてモバイル向け第12世代Coreプロセッサを発表 - GIGAZINE
GoogleがAIを用いてAI専用プロセッサの開発を爆速化したことを発表 - GIGAZINE
・関連コンテンツ
in ハードウェア, Posted by logu_ii
You can read the machine translated English article The CPU specs of 'Tachyum Prodigy', whic….