為什麼輝達、AWS、阿里都喜歡 Arm 的伺服器 CPU?

作者 | 發布日期 2023 年 12 月 04 日 8:10 | 分類 IC 設計 , 處理器 line share follow us in feedly line share
為什麼輝達、AWS、阿里都喜歡 Arm 的伺服器 CPU?


耕耘多年後,基於 Arm 架構的 CPU 在伺服器市場迎來大幅成長,被眾多客戶喜歡並採用。超大規模雲端服務商如亞馬遜雲端服務(AWS)、阿里巴巴、微軟等自研 CPU,都選擇和 Arm 合作,這是為什麼?

「答案非常簡單,透過和Arm合作,他們能夠根據自己的用例和基礎設施來打造並優化解決方案。」Arm高級副總裁兼基礎設施事業部總經理Mohamed Awad在2023 Arm Tech Symposia年度技術大會上表示。

與超大規模雲端服務商同樣喜歡Arm伺服器CPU可客製化特性的還有最重要的AI晶片供應商之一「輝達」。

在輝達強大的GH200超級晶片中,包含了72顆Arm Neoverse核心,加上輝達的GPU,GH200的AI性能較基於x86架構的系統可提升10倍。

為了滿足更多客戶在基礎建設中的客製化需求,Arm還有兩個重要措施。

為什麼首選Arm Neoverse CPU?

GH200 Grace Hopper 超級晶片平台是輝達今年5月發布的產品,專為處理大量的生成式AI任務而設計。擁有256個GH200超級晶片的NVIDIA DGX GH200超級計算機,其AI性能提升到了驚人的Exaflop(每秒一百萬兆次算)等級。

如此強大的AI效能,關鍵在於系統架構的變革。

▲ 基礎設施領域的傳統系統架構。

傳統的伺服器系統架構,記憶體透過PCIe,連接一個通用現成的CPU(也就是Host CPU),負責管理多個加速器。

「這種傳統架構是過去市場上唯一可用的架構」,Mohamed Awad指出,「這個架構的問題在於,通用現成的CPU以及加速器之間的介面直接限制了產品最終的效能水準。因為所有的加速器都必須透過這個通用現成的CPU存取額外的記憶體,無法達到記憶體的一致性,加速器的性能無法被充分利用,也就無法很好地支撐生成式AI的需求。」

▲ 面對新的應用需求,基礎設施領域出現了現代化的系統架構。

GH200超級晶片改變了傳統架構,透過NVLink,讓每個CPU都單獨和一個加速器相連,實現較強的記憶體一致性。其中的關鍵點之一就是可客製化的CPU,為此,借助這樣的架構,輝達能充分發揮GPU的效率,根據實際場景和用例實現效能最大化。

「只有了解最終用例,並且根據使用場景針對性地設計CPU,才能獲得更好的效率,達到產品最佳的表現性能。」Mohamed Awad進一步表示,「輝達攜手Arm,借助了Arm技術帶來的靈活性,設計出他們所需要的晶片以進一步優化系統,同時充分利用Arm強大的軟體生態系統。」

接下來的問題是,輝達提出的這種架構會成為生成式AI時代的主流嗎?

「現在判斷一個CPU對一個GPU做為加速器是不是未來的主趨勢,或唯一趨勢,仍為時過早。」Mohamed Awad表示,「我們正處於計算加速的時代,在未來的架構當中,不管透過什麼方式耦合,任何的通用CPU旁邊都一定會有一個加速器。Arm的獨特之處在於,能夠幫助合作夥伴從頭開始、根據所需構建定制化的CPU,做好CPU和加速器之間的連接。」

由於x86提供的是標準的CPU晶片,所以GH200超級晶片平台中CPU最佳的選擇只有Arm CPU,這也是Arm Neoverse受到歡迎的關鍵。

也就是說,標準化的CPU無法滿足基礎設施的客製化需求,可客製化成了Arm在伺服器市場的殺手鐧。

可自訂化,Arm在伺服器市場的「殺手鐧」

今年8月,Arm推出了Arm Neoverse計算子系統(CSS),促使Arm生態系統透過更低的成本、更少的風險以及更短的時間,打造出專用晶片。

Arm CSS的第一代產品Arm Neoverse CSS N2整合了Neoverse N2平台,並透過驗證配置且優化了功耗、效能與面積(PPA)。

「透過Neoverse CSS能夠幫助我們的合作夥伴進一步降低投資,加速整個生態系統對我們解決方案的可訪問性,同時加速合作夥伴產品的上市時間。」Mohamed Awad表示。

有Arm的客戶透過使用Neoverse CSS,節省了長達80人/年的工程師時間。還有客戶用了Neoverse CSS,專案從概念到流片只花了13個月。

微軟近期發布的Cobalt 100 CPU,也是基於Neoverse CSS。

「Arm Neoverse在中國市場,特別是基礎設施領域,有很多客戶,過去三四年發展也非常強勁。」Arm 中國區業務全球副總裁鄒挺說,「Arm也積極參與資料中心、雲端運算等本土的生態、開源軟體社區,包括龍蜥社區等,幫助這些社區能更好地融入Arm全球生態系統中。」

Mohamed Awad也強調,中國是Arm非常重要的市場之一,中國合作夥伴基於Arm架構晶片的總出貨量已累積達300億顆,Arm在中國有近400家技術授權客戶,這個數字每個月還在不斷攀升。

Arm全球的生態也是滿足客戶差異化需求的關鍵所在,在Neoverse CSS 的基礎之上,Arm推出了全面設計(Arm Total Design) ,進一步結合生態系統的力量,簡化客製晶片晶片的開發流程,並且讓交付變得更容易、更方便。

Arm全面設計的推出,讓ASIC設計公司可以快速啟動設計項目,並隨時可將其設計方案提供給所需的客戶;IP 供應商可以針對Neoverse CSS,進行預先整合、預先驗證和預先優化高級IP; EDA合作夥伴可以無縫支援最先進的工具和流程,簡化SoC設計;商業韌體解決方案可早於晶片流片之前便開始開發;與此同時,Neoverse CSS的設計將經過專門優化,充分發揮領先的製程節點的優勢。

顯然,在基礎設施追求差異化的時代,Arm Neoverse CSS和Arm全面設計是當下滿足差異化需求的最佳選擇。

也要注意到,Arm已經轉型為一家運算平台公司,如今Arm的全面運算解決方案(Arm Total Compute Solutions)、Arm Neoverse平台、Arm Corstone以及SOAFEE等運算平台都已經被廣泛應用於行動、基礎設施、物聯網以及汽車等領域。

(本文由 雷峰網 授權轉載;首圖來源:shutterstock)