摩爾線程推 MTT S4000 顯卡!支援 CUDA 程式碼,盼成輝達替代品

作者 | 發布日期 2023 年 12 月 21 日 17:38 | 分類 GPU , 中國觀察 , 晶片 line share follow us in feedly line share
摩爾線程推 MTT S4000 顯卡!支援 CUDA 程式碼,盼成輝達替代品


輝達(Nvidia)在中國市場最大競爭對手摩爾線程宣布推出 MTT S4000,用於 AI 和資料中心運算的最新顯卡,也是中國首個國產千卡千億模型訓練平台。

摩爾線程指出,公司最新旗艦產品將於 KUAE 智慧運算中心(智算中心)亮相。MTT S4000 採用第三代 MUSA 內核,具備 48GB 記憶體和 768GB/s 的記憶體頻寬,支援 CUDA 程式碼,並實現 CUDA 代碼零成本遷移到 MUSA 平台,做為取代輝達顯卡的替代品。

摩爾線程執行長張建中表示,摩爾線程 KUAE 智算中心正式啟用,是公司發展的重要里程碑。 摩爾線程構建從晶片到顯卡到集群的智算產品線,依託全功能 GPU 的多元運算優勢,滿足不斷增長的大模型訓練和推理需求,以綠色、安全的智慧算力,大力推動 AIGC、數位孿生、物理模擬、元宇宙等多模態應用的落地。

摩爾線程KUAE支援包括 DeepSpeed、Megatron-DeepSpeed、Colossal-AI、FlagScale 在內的業界主流分散式框架,並融合多種並行演算法策略,包括數據並行、張量並行、流水線並行和 ZeRO,且針對高效通訊運算並行和 Flash Attention 做了額外優化。

目前摩爾線程支援包括 LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各類主流大模型的訓練和微調。基於摩爾線程 KUAE 千卡集群,700 億到 1,300 億參數的大模型訓練,線性加速比均可達到 91%,算力利用率基本保持不變。以 2,000 億訓練數據量為例,智源研究院 700 億參數 Aquila2 可在 33 天完成訓練;1,300 億參數規模的模型可在 56 天完成訓練。

儘管摩爾線程不會很快與輝達、AMD 或英特爾等公司正面交鋒,不過美國制裁不僅給中國本土半導體業良好的存在理由,也減少摩爾線程和壁仞科技等公司的競爭,因為與輝達的中國專用卡相比,S4000 和 KUAE 勝算可能更大。

(首圖來源:摩爾線程

延伸閱讀: