2022年06月15日 06時00分ハードウェア

CPU・GPU・TPUをワンチップで担う「Tachyum Prodigy」のCPUスペックが明らかに、最大クロック周波数5.7GHz・128コア・TDP 950Wのモンスタースペック

半導体企業のTachyumが、CPU・GPU・TPUの機能を単一のアーキテクチャに統合したチップ「Prodigy」を発表しました。ProdigyのCPUスペックは最大128コア、動作周波数は5.7GHz、16チャネルDDR5メモリ、TDPは950Wとなっており、テクノロジーメディアのWccftechは「非常識なスペック」と評しています。

Tachyum's Prodigy CPU Specs Unveiled: 5nm Universal Processors With Up To 128 Cores, 5.7 GHz Clocks, 16-Channel DDR5-7200 Memory Support & 950W TDP
https://wccftech.com/tachyums-prodigy-cpu-specs-unveiled-5nm-universal-processors-up-to-128-cores-5-7-ghz-16-channel-ddr5-7200-memory-950w-tdp/

ProdigyはCPU・GPU・TPUのタスクを同一のチップ上で実行可能なユニバーサルプロセッサです。すべてのタスクを同一のチップ上で実行できるため、競合製品よりもコストを節約することが可能でありながら、高性能という特徴を有しています。TachyumはProdigyを発表したプレゼンテーションの中で、「ProdigyはHPC面ではIntelのXeon CPUの4倍のパフォーマンスを発揮し、NVIDIAのH100に対してはHPC面で3倍、AI＆推論ワークロード面では6倍のパフォーマンスを実現します」とそのハイパフォーマンスぶりをアピールしていました。また、競合他社のシステムと比較すると同じ電力で10倍以上のパフォーマンスを実現可能ともアピールしています。

Prodigyの特徴的なスペックは以下の通り。

・最大5.7GHzで動作する高性能ユニファイド64ビットコアを最大128個搭載
・16チャネルのDDR5メモリコントローラー
・PCIe 5.0が64レーン
・4ソケットおよび2ソケットのマルチプロセッササポート
・空冷式と液冷式の両方をサポートしたデータセンター向けラックソリューション
・SPEC CPU2017の整数演算パフォーマンスはIntel Xeon Platinum 8380の約4倍で、AMD EPYC 7763 HPCの約3倍
・倍精度浮動小数点数パフォーマンスはNVIDIA H100の約3倍
・AIFP8のパフォーマンスはNVIDIA H100の約6倍

Prodigyの各モデルのスペックは以下の通り。

	コア数	クロック周波数	メモリ	PCIe	TDP	市場セグメント
T16128-AIX	128	5.7GHz	16x DDR5-7200	Gen5 x64	950W	ハイエンドAI/HPC
T16128AIM	128	4.5GHz	16x DDR5-7200	Gen5 x64	700W	ミドルレンジAI/HPC
T16128-AIE	128	4.0GHz	16x DDR5-7200	Gen5 x64	600W	エントリーAI/HPC
T16128-HT	128	4.5GHz	16x DDR5-6400	Gen5 x64	300W	スループット
T864-HS	64	5.7GHz	8x DDR5-6400	Gen5 x32	300W	スピード
T864-HT	64	4.5GHz	8x DDR5-6400	Gen5 x32	300W	効率
T832-HS	32	5.7GHz	8x DDR5-6400	Gen5 x32	300W	エントリー
T832-LP	32	3.2GHz	8x DDR5-4800	Gen5 x32	180W	低電力

Prodigyは2つあるいは4つのマルチソケットをサポートしているため、4つのT16128-AIXからなる最大512コア・TDP 3800Wのシステムを構築することも可能。なお、ProdigyはすべてTSMCの5nmプロセスノードで製造され、命令セットアーキテクチャはネイティブおよびx86・ARMアーキテクチャ・RISC-Vに対応。

HPCおよびAI関連の固有の機能としては以下が挙げられています。

・コアあたり2x1024ビットベクトル単位
・コアあたり4096ビットのマトリックスプロセッサ
・FP64、FP32、TF32、BF16、Int8、FP8、TAIデータ型
・スパースデータ型は効率を最適化
・低精度数値型を使用した量子化のサポート
・行列を効率的に保存・ロードするためのスキャッター/ギャザー

TachyumはProdigy専用の空冷ラックや液冷ラックを用意しており、NVIDIAのH100 DGX PODを使用した場合のT16128-AIXの倍精度浮動小数点数(FP64)性能が約90T(テラ)FLOPSであるのに対して、専用空冷ラックなら最大6.2P(ペタ)FLOPS、液冷ラックなら最大12.9PFLOPSまでパフォーマンスを向上させることが可能です。

なお、Prodigyは2022年下半期にリリース予定となっており、さらに次世代モデルとなる「Prodigy 2」が2024年下半期に登場予定です。Prodigy 2について、Tachyumは「製造プロセス3nmで、より多くのコア・メモリ・メモリ帯域幅を持ち、PCIe 6.0およびCXLに対応する」としています。