Arm 伺服器再添新成員,NVIDIA Grace 率先採用

作者 | 發布日期 2022 年 09 月 21 日 8:45 | 分類 伺服器 , 晶片 , 處理器 Telegram share ! follow us in feedly


近兩年,Arm 伺服器晶片發展迅猛。2018 年 10 月推出雲端到邊緣基礎設施產品 Arm Neoverse,承諾 2022 年及未來,Neoverse 平台能效保持 30% 年增長率。

後來承諾未兌現,但Arm有更完整的產品規劃,為Neoverse部署三系列產品,包括考慮性能、功率和面積,擅長可拓展的N系列;能提供最佳性能,相對消耗更多面積和功耗的V系列;更關注效率,功耗和面積縮減最佳化的E系列。

15日Arm宣布伺服器晶片Arm Neoverse藍圖再添新成員,同時推出Neoverse V2平台(代號「Demeter」)和Neoverse E2平台,伺服器晶片適用範圍再擴大。

▲ Arm Neoverse產品藍圖。(Source:Arm

依然重視單線程性能,相比V1性能提升尚不清晰

Arm看來,單晶片性能和單線程性能是雲端服務商選擇伺服器晶片兩大關鍵指標,高單晶片性能能讓雲端服務商透過大量平台「橫向擴展」工作負載,實現投資價值最大化,即大型網路公司關注的TCO支出的性能。

因此單晶片和單線程性能是Arm Neoverse十分看重性能指標。現有市場使用Arm Neoverse V1核心的AWS Graviton3可提供最高的單線程性能。Arm與合作夥伴打磨Neoverse V2的過程,也有客戶表示希望提升雲端工作負載性能,平衡功耗和面積同時推進單線程性能。與Neoverse V1相比,Arm尚未給予Neoverse V2性能提升的詳細資訊,但發表會解釋Neoverse V2提升性能的措施。

雲端工作負載方面,Arm使用SPEC Integer Rate測量預估值,一直利用模型各種雲端基礎設施工作負載調整微架構,以提升整體可拓展性能。由於現代雲端應用程式有大型工作資料庫,接近CPU的位置保留盡可能多數據,將帶來更高性能。Neoverse V2增加2MB專用L2快取,比Neoverse V1的L2大一倍,同時保持延遲負載不變。

對HPC之類快速遷移到雲端的工作負載而言,向量性能依然重要,機器學習(ML)正是關鍵雲端工作負載。Neoverse V2完成SVE過渡到SVE2,幫助滿足更多非HPC ML類型的工作負載。安全方面,Neoverse V2引入關鍵Armv9安全增強功能,防禦常見的記憶體攻擊。

Arm的Neoverse E2平台,結合Arm Cortex-A510 CPU與可擴展的Neoverse CMN-700和N2系統背板,如此條件相對受限的應用也能充分利用可擴展的核心數量範圍、Arm SystemReady相容性及PCIe、CXL、IO 和接口等雲端技術。

NVIDIAGrace率先採用V2,每瓦性能提升2倍

目前有多家廠商基於V2設計,NVIDIAGrace CPU就是率先搭載V2的廠商之一。Grace是NVIDIA「三晶片」(CPU、GPU、DPU)戰略的一部分,基於Neoverse V2核心,提供高達72個核心,並藉NVIDIA最新NVLink-C2C互連技術與GPU結合,致力解決高性能應用難題。

Grace為何會選擇Arm Neoverse V2核心?Arm發表會,NVIDIA超大規模和HPC副總裁兼總經理Ian Buck解釋:「將CPU與GPU這種為解決AI等大規模數據並行問題的處理器相結合,我們需要表現優異的CPU與之並駕齊驅。我們對Neoverse V2的SPEC FP與SPEC int性能表現印象非常深刻,也可與GPI本身數據處理並駕齊驅。」

「它的能效也很出色,具優異每瓦性能結合Grace的LP DDR記憶體,與替代品相比,這項結合有高達2倍以上每瓦性能提升。我們非常高興採用Arm的技術。」Ian Buck說。

不只NVIDIA,中國近兩年興起的CPU、DPU新創也基於Arm Neoverse核心開發晶片。CPU領域,專注打造伺服器CPU的遇賢微電子和鴻鈞微電子均採用Arm Neoverse核心。遇賢微電子CEO及創始人羅勇表示,研究Arm Neoverse伺服器架構提供的機會和潛力,對資料中心和雲端原生而言非常出色。

遇賢微為中國市場雲端計算資料中心領域涉及基於Neoverse N2的伺服器CPU,也與Linaro和openEuler Linux操作系統等Arm開源社群生態合作,支援多家軟體供應商,確保大型網路雲端計算服務提供商專用的Linux版無縫銜接基於Neoverse N2伺服器的CPU晶片。

鴻鈞微電子第一款產品也是基於Neoverse N2打造,預計明年底面世。「我們正與中國客戶交流,包括網路公司、雲端服務提供商及傳統垂直行業客戶,他們都非常興奮,並期待這款基於Neoverse N2的伺服器CPU產品推出。」

另一熱門的DPU領域,雲豹智能也在SoC產品採用大量Arm Neoverse CPU。首席架構師及聯合創始人莫志城表示:「資料中心快速從以CPU為中心轉變為以DPU為中心。要應對趨勢,我們必須最佳化DPU,不僅要能處理卸載並非常高效處理數據,且必須具高度靈活和可編程能力。由於可編程DPU依賴非常強大且非常高效的功率和高性能CPU,如下一代Neoverse。」

(本文由 雷鋒網 授權轉載;首圖來源:NVIDIA