Feynman 世代藍圖一次看：Rosa CPU 登場、銅與 CPO 雙軌 Scale-up 架構成形

輝達（NVIDIA）在 GTC 大會中更新自家資料中心的產品路線圖，除了眾所矚目的 Vera Rubin 平台外，還公布了下一世代 GPU 的「Feynman」價格，以及從未在路線圖中出現過的 Rosa CPU。

2026 年重點產品：Rubin、Vera、LP30

在 2026 年路線圖中，NVIDIA 推出基於 Vera CPU 與 Rubin GPU 的 Vera Rubin 平台，並搭配五款處理器，包括低延遲推論加速器 Groq LP30、資料處理器（Data Processing Unit，簡稱 DPU）BlueField-4、NVLink6 交換器，整合共封裝光學（CPO）的 Spectrum–6 乙太網路平台，以及 ConnectX-9 SuperNIC。

執行長黃仁勳指出，Vera Rubin 代表跨世代的躍進，七款突破性晶片、五組機架、一台巨型超級電腦，旨在驅動 AI 的每一個階段。這些晶片目標透過協同運作來組成一台強大的 AI 超級電腦，驅動 AI 的各個階段，從大規模預訓練、後訓練、測試階段擴展，到即時的代理型推論皆涵蓋其中。

新一代的 Vera Rubin NVL72 整合 72 顆 Rubin GPU 與 36 顆 Vera CPU，透過 NVLink 6 進行互連，並搭配 ConnectX-9 SuperNIC 與 BlueField-4 DPU，帶來突破性的運算效率。該系統在訓練大型混合專家模型時，所需 GPU 數量僅 Blackwell 平台的四分之一，每瓦的推論資料輸送量最高可提升 10 倍，每個 Token 成本僅先前的十分之一。

Vera Rubin 系統採用 100% 水冷設計，使用 45°C 的溫水進行冷卻，徹底移除傳統繁雜的纜線，大幅減輕資料中心的冷卻壓力與能源成本。此外，Vera CPU 是全球首款採用 LPDDR5 記憶體的資料中心 CPU，並提供最高 1.2 TB/s 頻寬，相較一般通用型 CPU，頻寬可提升至兩倍、功耗僅為一半。

這次主題演講中，另一個值得注意的便是專容納 Groq 新型加速器的「Groq 3 LPX」，這是專為低延遲和大型情境需求所設計，該機架可容納 256 顆 LPU，並擁有 128GB 晶片內 SRAM 及 640 TB/s 的擴展頻寬。透過 LPX 與 Vera Rubin 結合，可使每兆瓦的推論資料輸送量最高可提升 35 倍，同時創造出多達 10 倍的營收機會。LP30 晶片採用三星 4 奈米製程，預期第三季開始出貨，下一代 LP35 預期也會由三星操刀。

2027 年重點產品：Rubin Ultra、LP35、Kyber 機架

到了 2027 年，NVIDIA 計畫推出升級版 Rubin Ultra 平台。根據外媒 Tom’s Hardware 報導，該產品將採用四個運算小晶片（chiplet），並搭載 1TB 容量的 HBM4E 記憶體。此外，這些 GPU 加速器將搭配 Groq LP35 LPU，並支援 NVFP4 資料格式。目前預期到 2028 年的 Feynman 世代時，會推進至 LP40 LPU 設計，並透過 NVLink 進行連接。

在機架系統擴展部分，NVIDIA 展示了最新一代 Kyber 機架，這是專為 Rubin Ultra 運算節點設計的系統，預期將於 2027 年導入，並搭載容納 576 顆 NVIDIA Rubin Ultra GPU 的高密度平台。

從藍圖來看，NVIDIA 會維持 Kyber 與 Oberon（為 Blackwell 世代產品，主要用於銅線 Scale-up）架構雙軌制，到 2028 年的 Feynman 世代，Kyber 系統將接替 Oberon 成為超大規模擴展的主要設計，並從 NV144 規模擴展到 NVL 1152 的規模。

新型的 Kyber 機架採用垂直插入設計，而非水平托架，並預設使用液冷散熱。

根據官網介紹，Kyber 機架將運算刀鋒（compute blade，即輕薄型的伺服器模組）如同書架上的書本般垂直旋轉排列，Kyber 每部機箱最多可容納 18 組運算刀鋒，再透過無線中介背板在機箱後方整合專用 NVLink 交換刀鋒，使其成功在單一機架中連接多達 144 個 Rubin Ultra GPU（透過 NVLink 7 交換器互連），突破傳統銅纜連接的距離限制。

相較採用 72 顆 Blackwell GPU 的 Oberon NVL72 機櫃，Kyber NVL144 機櫃整體效能至少提升 4 倍。