摩爾線程推 MTT S4000 顯卡!支援 CUDA 程式碼,盼成輝達替代品

作者 | 發布日期 2023 年 12 月 21 日 17:38 | 分類 GPU , 中國觀察 , 晶片 line share Linkedin share follow us in feedly line share
Loading...
摩爾線程推 MTT S4000 顯卡!支援 CUDA 程式碼,盼成輝達替代品

輝達(Nvidia)在中國市場最大競爭對手摩爾線程宣布推出 MTT S4000,用於 AI 和資料中心運算的最新顯卡,也是中國首個國產千卡千億模型訓練平台。

摩爾線程指出,公司最新旗艦產品將於 KUAE 智慧運算中心(智算中心)亮相。MTT S4000 採用第三代 MUSA 內核,具備 48GB 記憶體和 768GB/s 的記憶體頻寬,支援 CUDA 程式碼,並實現 CUDA 代碼零成本遷移到 MUSA 平台,做為取代輝達顯卡的替代品。

摩爾線程執行長張建中表示,摩爾線程 KUAE 智算中心正式啟用,是公司發展的重要里程碑。 摩爾線程構建從晶片到顯卡到集群的智算產品線,依託全功能 GPU 的多元運算優勢,滿足不斷增長的大模型訓練和推理需求,以綠色、安全的智慧算力,大力推動 AIGC、數位孿生、物理模擬、元宇宙等多模態應用的落地。

摩爾線程KUAE支援包括 DeepSpeed、Megatron-DeepSpeed、Colossal-AI、FlagScale 在內的業界主流分散式框架,並融合多種並行演算法策略,包括數據並行、張量並行、流水線並行和 ZeRO,且針對高效通訊運算並行和 Flash Attention 做了額外優化。

目前摩爾線程支援包括 LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各類主流大模型的訓練和微調。基於摩爾線程 KUAE 千卡集群,700 億到 1,300 億參數的大模型訓練,線性加速比均可達到 91%,算力利用率基本保持不變。以 2,000 億訓練數據量為例,智源研究院 700 億參數 Aquila2 可在 33 天完成訓練;1,300 億參數規模的模型可在 56 天完成訓練。

儘管摩爾線程不會很快與輝達、AMD 或英特爾等公司正面交鋒,不過美國制裁不僅給中國本土半導體業良好的存在理由,也減少摩爾線程和壁仞科技等公司的競爭,因為與輝達的中國專用卡相比,S4000 和 KUAE 勝算可能更大。

(首圖來源:摩爾線程

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》