輝達 Vera Rubin 預計下半年量產，Groq 技術動向將於 GTC 揭露

輝達宣布這週已出貨首批 Vera Rubin 平台樣品，並預計今年下半年開始量產；同時，OpenAI 最新 GPT-5.3 Codex 已在 Grace Blackwell 與 NBL72 系統上完成訓練與推論部署。

今電話會議上，輝達表示 Vera Rubin 採模組化設計，相較 Blackwell 具備更佳韌性與可維修性；在 MOE（Mixture of Experts）模型訓練上可用更少 GPU，並將推論每 token 成本降低最多 10 倍。

在模型合作方面，輝達指出，最近推出的 GPT-5.3 Codex 該模型使用 Grace Blackwell 與 NBL72 系統進行訓練與推論。GPT-5.3 Codex 可處理涉及研究、工具使用與複雜執行的長時間任務，代表 Agentic AI 能力已邁入實用階段。

該模型目前已在輝達內部廣泛部署，工程團隊高度依賴 Codex 協助開發與流程自動化，創辦人暨執行長黃仁勳表示，Agentic AI 的關鍵拐點已到來，前沿模型公司正加速擴張訓練與推論規模，更直言內部工程師「非常喜愛」這套系統。

輝達指出，Physical AI 與邊緣 AI 需求同步成長，Jetson 等嵌入式平台在機器人與自主系統領域持續擴張。隨著資料中心與實體 AI 應用雙線推進，公司正加速布局從訓練、推論到 AI 工廠規模化的完整技術堆疊。

雲端合作亦持續深化。Grace Blackwell 系統已在主要 CSP 與 hyperscaler 中大規模部署，NVLink scale-up 架構成為超大規模 AI 訓練與推論的核心技術。

值得注意的是，輝達亦引入 Groq 的低延遲推論技術與相關工程團隊，並將其整合至 NVIDIA 架構中，進一步提升 AI 基礎設施效能與成本效益。更多進展預計將於下月 GTC 對外揭露，業界預期將為 LPU 與推論市場帶來新一波技術升級。

（首圖來源：NVIDIA）

從這裡可透過《Google 新聞》追蹤 TechNews

科技新知，時時更新

想請我們喝幾杯咖啡？