2023年12月20日

中国のGPUメーカー「Moore Threads」がAIトレーニングやデータセンター向けGPU「MTT S4000」を発表



中国の新興GPUメーカー「Moore Threads」が、2023年12月19日にAIのトレーニングやデータセンター向けGPU「MTT S4000」を発表しました。公式発表によると、MTT S4000のMUSIFYツールはNVIDIAのCUDAとの完全な互換性があるとのことです。



摩尔线程首个千卡智算中心落地,从算力到生态全面加速大模型发展 | 摩尔线程

https://www.mthreads.com/news/146



Nvidia's biggest Chinese competitor unveils cutting-edge new AI GPUs — Moore Threads S4000 AI GPU and Intelligent Computing Center server clusters using 1,000 of the new AI GPUs | Tom's Hardware

https://www.tomshardware.com/pc-components/gpus/nvidias-biggest-chinese-competitor-unveils-cutting-edge-new-ai-gpus-moore-threads-s4000-ai-gpu-and-intelligent-computing-center-server-clusters-using-1000-of-the-new-ai-gpus



Moore Threads introduces MTT S4000 48GB AI GPU with MTLink and zero-cost NVIDIA CUDA framework translation - VideoCardz.com

https://videocardz.com/newz/moore-threads-introduces-mtt-s4000-48gb-ai-gpu-with-mtlink-and-zero-cost-nvidia-cuda-framework-translation



Moore Threads Unveils MTT S4000 GPU: Equipped With 48 GB Memory, 200 TOPS AI Compute, Gen5 Ready

https://wccftech.com/moore-threads-mtt-s4000-gpu-48-gb-memory-200-tops-ai-gen5-ready/



Moore ThreadsはNVIDIAの元グローバルバイスプレジデントであるZhang Jianzhong(张建中)氏が2020年10月に設立したGPU企業。これまでMoore ThreadsはLenovoを含む他の多くの中国企業との提携を行い、さまざまなハードウェアやソフトウェアをリリースしてきました。





今回発表された「MTT S4000」は、独自のアーキテクチャ「Moore Threads Unified System Architecture(MUSA)」の第3世代を採用したコアを搭載していることが大きな特徴です。



MTT S4000と2022年11月に発表された「MTT S3000」、2022年4月発表の「MTT S2000」を比較した表が以下。



MTT S4000 MTT S3000 MTT S2000 アーキテクチャ 第3世代MUSA 第2世代MUSA 第1世代MUSA 演算性能 不明 15.2TFLOPS 12TFLOPS メモリ 48GB GDDR6 32GB GDDR6 32GB フォームファクタ デュアルスロットパッシブ デュアルスロットパッシブ シングルスロットパッシブ インターフェイス PCIe Gen5 x16 PCIe Gen4 x16 APIサポート 不明 DirectX, Vulkan, OpenGL, OpenGL ES OSサポート 不明 X86/ARM/LoongArch 接続可能ディスプレイ 最大4つのDisplayPort接続 DisplayPort 1.4 (最大解像度8K)



一方で、海外メディアのTom's Hardwareによると、MTT S4000はNVIDIAが2020年にリリースした「NVIDIA Ampereアーキテクチャ」や2022年の「NVIDIA Ada Lovelace アーキテクチャ」の性能には及ばないとのこと。それでも、Tom's Hardwareは「MTT S4000は48GBというメモリ容量と毎秒768GBというメモリ帯域幅を備えているため、ある程度のAIや大規模言語モデルのトレーニングには役立つでしょう」と述べています。





また、Moore ThreadsはMTT S4000について、「MTT S4000に搭載されている独自のMUSIFYツールは、NVIDIAのCUDAと完全な互換性があるため、CUDAプラットフォーム上で作成したコードをMUSAのプラットフォームに移行することが容易にできるため、移行のコストを抑えつつ、パフォーマンスの低下がなくなります」とアピールしています。



さらにMoore ThreadsはMTT S4000を約1000枚搭載したAIトレーニングクラスターの「KUAE Intelligent Computing Center」を発表。このKUAE Intelligent Computing Centerは、MTT S4000とRDMAネットワーキング、分散型のストレージ、統合クラスター管理ソフトウェアを組み合わせたものです。





Moore ThreadsはKUAE Intelligent Computing Centerの性能について、約700億のパラメーターを持つ大規模言語モデル「Aquila2」のトレーニングをKUAE Intelligent Computing Centerで行った場合、トレーニング完了までに要する日数は33日とのこと。



Moore Threadsによると、MTT S4000単体での販売を行う予定はなく、KUAE Intelligent Computing Centerに関心を持つ大口顧客に向けて販売する予定とのことです。