Hot Chips 2023》世界首顆資料中心等級 RISC-V 處理器:Ventana Veyron V1

作者 | 發布日期 2023 年 09 月 12 日 7:50 | 分類 IC 設計 , 伺服器 , 半導體 line share follow us in feedly line share
Hot Chips 2023》世界首顆資料中心等級 RISC-V 處理器:Ventana Veyron V1


處理器業界一直有一種觀點:Arm 是下個 RISC / Unix 伺服器,而 RISC-V 是下個 Arm(Arm Is The New RISC / Unix,RISC-V Is The New Arm)。

雲端巨頭紛紛自行打造處理器,繼 Calxeda、Applied Micro、AMD、Marvell、Nvidia 和三星等製造 Arm 伺服器晶片的第一波嘗試,博通(Broadcom)、高通(Qualcomm)和 Nuvia 第二波努力,Arm 指令集相容處理器由 AWS 自研 Graviton 和 Arm 推出 Neoverse 引領第三波浪潮,終於衝破資料中心大門。

對嶄新工作覆載,雲端巨頭也沒有「非 x86 不可」需求,同等性能的雲端實例(Cloud Instance),相較 x86,Arm 也有 30%~40% 性價比優勢,注定 Arm 成為超大規模雲服務的首選。

▲ 相容 RISC-V 指令集的 Veyron V1 是首款「資料中心等級」RISC-V 處理器。

分別掌握行動平台和高效能運算市場的 Arm 與 x86,近來因自由度極高崛起的 RISC-V 多半用於低功耗嵌入式平台,但也不乏企圖將 RISC-V 推入資料中心的公司。新創 Ventana Microsystems 2022 年 12 月發表相容 64 位元 RISC-V 指令集的 Veyron V1 處理器,採用類 AMD EPYC 的 Chiplet 設計,允許客戶購買 CPU 模組和 I/O Hub(含記憶體控制器和 PCIe),最多可擴展到 192 個核心(12 個 CPU 模組),然後整合自己的加速器,實作出一顆完整晶片。

Veyron V1 處理器有不少值得留意的巧思,即使覺得「反正資料中心的高階伺服器處理器都長那個樣子」。

▲ 對還不知道客戶在哪裡的新創公司,目標不外乎有講跟沒講一樣的「只要我們能找到需求」。

▲ 一個 Veyron V1 處理器 CPU Chiplet 含 16 個核心(台積電 5 奈米),接著跟有 DDR 記憶體控制器和 PCIe 等功能的 I/O Hub(推測是台積電 6 奈米) 結合,最多可延展至 192 個核心,並整合特定領域加速器。

▲ 更多 Veyron V1 處理器關鍵規格:每個時脈週期最多可解碼 8 個指令、每個核心有 1MB L2 快取,全部核心共享的 L3 快取最高容量 48MB,伺服器該有的特性如虛擬化、記憶體資料保護、和防禦旁路攻擊(Side-band Attack) 等。

▲ 對應指令集以 RV64GC(意指 RISC-V 64-bit, extensions G and C) 為基礎再延伸。讓人訝異的是,Veyron V1 支援「可在虛擬機器架設虛擬機器」的巢狀虛擬化(Nested Virtualization),這個連 Arm Neoverse N1 都做不到。

▲ Veyron V1 核心微架構的相關細節,但說穿了跟其他高效能處理器如出一轍,像追求能效、與指令管線解耦的分支預測與指令擷取、執行單元將部份相連指令融合為單一運算等。

▲ Veyron V1 指令快取頗具特色:充當 L1 / L2 大型化 512kB 指令快取,搭配一塊當指令迴圈緩衝區(Loop Buffer)的超小型 L0 快取。

▲ Veyron V1 指令管線全貌,坦白講,畫成這樣的確很難理解。

▲ Veyron V1 為了確保每時脈週期可擷取並解碼 8 個指令,從分支預測、指令快取、指令 TLB、指令擷取到指令預先解碼,都要有因應配套措施。

▲ Veyron V1 記憶體載入和回存單元,每時脈週期可同時執行總計四個載入/回存。

▲ Veyron V1 單一 CPU 模組最多 16 核,L3 快取最高容量是48MB,並兼具快取資料一致性協定的窺探過濾器(Snoop Filter)角色。

▲ Veyron V1 打從一開始就走 Chiplet 路線,相容 Arm 制定的 AMBA CHI(Coherent Hub Interface)界面。

▲ 128 核 Veyron V1,時脈 3.6GHz、功耗 280W 時,性能可超越 40 核英特爾 Xeon 8380、64 核 AMD EPYC 7763 和 64 核 AWS Graviton3,但能否抗衡英特爾第四代 Xeon-SP 和 AMD 第四代 EPYC 就有點存疑。

▲ Veyron V1 的 CPU 模組使用台積電 5 奈米製程參考實作:16 核心結合 48MB L3 快取記憶體(每核心 3MB),耗電量約 40W。

但有件事不得不提:Veyron V1 看來並沒有 SIMD 或向量執行單元,這對上有 AVX-512 的 AMD Zen 4c 會非常吃虧。

至於「RISC-V 進軍資料中心」,Ventana Microsystems 的 Veyron V1 處理器可謂開了第一槍,但缺乏向量運算能力的 Veyron V1,追求吞吐量應用(如視訊編碼器和繪圖相關)會非常吃虧,即便下一版 Veyron V2 補回,RISC-V 生態系統依然遠不如 Arm 和 x86 成熟,必須另外編寫軟體支援向量擴展。以前 Arm 試圖將自己塑照成 x86 替代品的過程,就多次面臨軟體支援難題,RISC-V 只會面對更艱鉅的挑戰。

Ventana Microsystems 計畫是,客戶應能在第二季或第三季收到 Veyron V1 處理器樣品,屆時就能知道世界首顆資料中心等級 RISC-V 處理器,究竟有多大能耐。

(首圖來源:Ventana Micro Systems

延伸閱讀: