
在全球人工智慧(AI)運算能力與效率需求急遽攀升的浪潮下,日前 GPU 大廠輝達 (NVIDIA) 正式發布兩項劃時代創新技術,包括新一代專為大規模情境(context)處理設計的 Rubin CPX GPU,以及將成為其系統關鍵基礎的 NVIDIA MGX PCIe Switch Board with ConnectX-8 SuperNICs。兩者結合,預示著 AI 運算正邁向高效能、高效率與高擴展性的全新時代。
輝達Rubin CPX GPU的核心使命,是突破AI系統在「長情境」推論上的瓶頸。隨著AI模型逐漸龐大,處理數百萬詞元的需求愈加常見,無論是大型軟體專案分析、長篇文件理解,或是一小時長度的影片生成,都對傳統GPU構成挑戰。Rubin CPX則以全新設計打破限制,能在單一晶片上整合影片解碼器、編碼器與長情境推論處理,提供前所未有的速度與效能。
對此,輝達創辦人暨執行長黃仁勳指出,Rubin CPX是首款專為大規模情境AI設計的CUDA GPU,與Vera Rubin CPU及Rubin GPU協同運作,組成 Vera Rubin NVL144 CPX平台。單一機架下可提供高達 8 exaflops 的AI運算能力,效能是現有GB300 NVL72系統的7.5倍。而且,該系統同時配置 100TB記憶體與每秒1.7PB頻寬,讓資料能以極高速流動,支撐嚴苛的AI工作負載。輝達亦提供 Rubin CPX運算托盤,協助客戶延伸既有Vera Rubin系統的投資效益。
在效能規格上,Rubin CPX採用 NVFP4精度,運算力達30 petaflops,並配備 128GB GDDR7記憶體,能以極高能源效率處理大規模AI推論。與GB300 NVL72相比,Rubin CPX系統專注力提升3倍,使AI模型能處理更長的情境序列,維持高效能而不降速。
根據Facebook專頁粉絲頁「Richard只談基本面-Richard’s Research Blog」所發布的內容顯示,Rubin CPX具備高度彈性,能與Quantum-X800 InfiniBand橫向擴展架構或Spectrum-XGS乙太網路平台相結合,搭配NVIDIA ConnectX-9 SuperNICs,滿足不同企業需求。對此,NVIDIA更指出,每投資1億美元於Rubin CPX,即能帶來高達50億美元的詞元收益,展現極具吸引力的投資回報,將AI技術直接轉化為可觀的商業價值。
為了支撐Rubin CPX的龐大效能,輝達同步推出了 PCIe Switch+CX8 I/O板。這是全球首款量產的 PCIe 6.0規格 I/O產品,將PCIe Switch晶片與ConnectX-8 SuperNIC整合於同一大板,搭載9個PCIe插槽與8個NIC連接器。
與傳統主機板不同,該I/O板不包含CPU,而是專為PCIe架構的AI GPU伺服器(如RTX Pro 6000/5000系列)設計,並將在Rubin CPX系統中扮演「scale-up」與「scale-out」互聯的關鍵角色。其技術優勢,除高度整合,能將PCIe Switch與CX8 NIC二合一,簡化伺服器設計,降低元件數量之外,裝置間可直接以PCIe 6.0速度通信,每張RTX Pro 6000 GPU速率達400Gb/s,CX8 NIC則高達800Gb/s。而且,藉由8張GPU間可實現all-to-all進行高速內部通訊而無需回CPU,大幅降低延遲。甚至是減少小板阻礙風流,提升伺服器內部散熱效率,進一步優化散熱狀況等。
在粉絲頁的內容中指出,強化PCIe AI GPU伺服器性能,降低技術門檻,並部分取代Broadcom PCIe Switch市場。此產品已量產出貨,並在Rubin CPX運算托盤中發揮更深戰略作用。也就是透過整合,將高密度PCB上的晶片數量減半,進一步提升規模化部署的可行性。目前,多家AI創新企業已率先展開應用。包括Cursor,透過Rubin CPX加速智慧程式碼生成,協助開發者更高效創作。而Runway則是利用其效能生成長情境電影級內容,提升影片創作靈活性。至於Magic,則是藉由處理億級詞元的能力,讓AI代理能完整理解軟體程式庫與互動歷史,加速自動化軟體工程。
除了硬體的創新發展之外,Rubin CPX將完整支援輝達 AI技術堆疊,包括Dynamo平台(提升推論輸送量並降低延遲)、Nemotron多模態模型與NVIDIA AI Enterprise套件。結合NIM微服務、AI框架與工具,企業可輕鬆部署於雲端、資料中心與工作站。同時,輝達 CUDA-X程式庫、600萬開發者社群與近6000種CUDA應用,將進一步推動Rubin CPX生態擴張,確保硬體優勢能快速轉化為實際應用。
根據輝達的說法,NVIDIA Rubin CPX預計於2026年底上市。雖然仍有一段時間,但其對長情境處理、系統整合及投資效益的突破,已使業界高度期待。Rubin CPX與PCIe Switch+CX8 I/O板的結合,不僅是AI硬體架構的革新,更是AI應用邁向成熟與普及的重要里程碑。
(首圖來源:輝達提供)