
輝達(NVIDIA)在 GTC 大會中更新自家資料中心的產品路線圖,除了眾所矚目的 Vera Rubin 平台外,還公布了下一世代 GPU 的「Feynman」價格,以及從未在路線圖中出現過的 Rosa CPU。
2026 年重點產品:Rubin、Vera、LP30
在 2026 年路線圖中,NVIDIA 推出基於 Vera CPU 與 Rubin GPU 的 Vera Rubin 平台,並搭配五款處理器,包括低延遲推論加速器 Groq LP30、資料處理器(Data Processing Unit,簡稱 DPU)BlueField-4、NVLink6 交換器,整合共封裝光學(CPO)的 Spectrum–6 乙太網路平台,以及 ConnectX-9 SuperNIC。
執行長黃仁勳指出,Vera Rubin 代表跨世代的躍進,七款突破性晶片、五組機架、一台巨型超級電腦,旨在驅動 AI 的每一個階段。這些晶片目標透過協同運作來組成一台強大的 AI 超級電腦,驅動 AI 的各個階段,從大規模預訓練、後訓練、測試階段擴展,到即時的代理型推論皆涵蓋其中。
新一代的 Vera Rubin NVL72 整合 72 顆 Rubin GPU 與 36 顆 Vera CPU,透過 NVLink 6 進行互連,並搭配 ConnectX-9 SuperNIC 與 BlueField-4 DPU,帶來突破性的運算效率。該系統在訓練大型混合專家模型時,所需 GPU 數量僅 Blackwell 平台的四分之一,每瓦的推論資料輸送量最高可提升 10 倍,每個 Token 成本僅先前的十分之一。
Vera Rubin 系統採用 100% 水冷設計,使用 45°C 的溫水進行冷卻,徹底移除傳統繁雜的纜線,大幅減輕資料中心的冷卻壓力與能源成本。此外,Vera CPU 是全球首款採用 LPDDR5 記憶體的資料中心 CPU,並提供最高 1.2 TB/s 頻寬,相較一般通用型 CPU,頻寬可提升至兩倍、功耗僅為一半。
這次主題演講中,另一個值得注意的便是專容納 Groq 新型加速器的「Groq 3 LPX」,這是專為低延遲和大型情境需求所設計,該機架可容納 256 顆 LPU,並擁有 128GB 晶片內 SRAM 及 640 TB/s 的擴展頻寬。透過 LPX 與 Vera Rubin 結合,可使每兆瓦的推論資料輸送量最高可提升 35 倍,同時創造出多達 10 倍的營收機會。LP30 晶片採用三星 4 奈米製程,預期第三季開始出貨,下一代 LP35 預期也會由三星操刀。
2027 年重點產品:Rubin Ultra、LP35、Kyber 機架
到了 2027 年,NVIDIA 計畫推出升級版 Rubin Ultra 平台。根據外媒 Tom’s Hardware 報導,該產品將採用四個運算小晶片(chiplet),並搭載 1TB 容量的 HBM4E 記憶體。此外,這些 GPU 加速器將搭配 Groq LP35 LPU,並支援 NVFP4 資料格式。目前預期到 2028 年的 Feynman 世代時,會推進至 LP40 LPU 設計,並透過 NVLink 進行連接。
在機架系統擴展部分,NVIDIA 展示了最新一代 Kyber 機架,這是專為 Rubin Ultra 運算節點設計的系統,預期將於 2027 年導入,並搭載容納 576 顆 NVIDIA Rubin Ultra GPU 的高密度平台。
從藍圖來看,NVIDIA 會維持 Kyber 與 Oberon(為 Blackwell 世代產品,主要用於銅線 Scale-up)架構雙軌制,到 2028 年的 Feynman 世代,Kyber 系統將接替 Oberon 成為超大規模擴展的主要設計,並從 NV144 規模擴展到 NVL 1152 的規模。
新型的 Kyber 機架採用垂直插入設計,而非水平托架,並預設使用液冷散熱。
根據官網介紹,Kyber 機架將運算刀鋒(compute blade,即輕薄型的伺服器模組)如同書架上的書本般垂直旋轉排列,Kyber 每部機箱最多可容納 18 組運算刀鋒,再透過無線中介背板在機箱後方整合專用 NVLink 交換刀鋒,使其成功在單一機架中連接多達 144 個 Rubin Ultra GPU(透過 NVLink 7 交換器互連),突破傳統銅纜連接的距離限制。
相較採用 72 顆 Blackwell GPU 的 Oberon NVL72 機櫃,Kyber NVL144 機櫃整體效能至少提升 4 倍。
▲ Kyber 機架的中板(Midplane)。
2028 年重點產品:Feynman、Rosa、LP40,NVLink 走向銅線/光學雙軌
來到 2028 年,Feynman GPU 將有兩大亮點,一是採用晶粒堆疊(die stacking)、二是客製化 HBM 記憶體,意味著需要更高密度的 Chiplet 設計與 3D 堆疊。
Rosa CPU 則是 NVIDIA 自行開發的下一代處理器,主打極致單執行緒效能,而 Rosa 的出現也顯示 NVIDIA 已將 CPU 開發週期從原本約四年縮短至兩年,與 AMD 和英特爾等主要 CPU 廠商看齊。
執行長黃仁勳指出,Feynman 也會搭配新的 LP40,並推出全新 Rosa CPU、BlueField-5 以及新一代 SuperNIC CX10;至於 Kyber 機架,則有銅互連和 CPO 兩種 Scale-up 版本,他強調「我們將首次同時透過銅與 CPO 進行系統擴展」。
面對市場對未來互連技術的關注,無論是「銅線是否仍然重要」,或是「是否打算透過光學進行 Scale-up 與 Scale-out」,黃仁勳稱答案都是「Yes」;同時他也向生態系夥伴喊話,不管是銅線、光學還是 CPO ,「我們都需要更多產能!」
- Nvidia demonstrates Rubin Ultra tray, the world’s first AI GPU with 1TB of HBM4E memory — new chips will slot into Kyber racks
- Nvidia updates data center roadmap with Rosa CPU and stacked Feynman GPUs — optical NVLink, Groq LPUs with NVFP4, and NVLink also on deck
(首圖來源:NVIDIA 直播截圖)






