輝達 Vera Rubin 預計下半年量產,Groq 技術動向將於 GTC 揭露

作者 | 發布日期 2026 年 02 月 26 日 7:19 | 分類 GPU , Nvidia , 半導體 line share Linkedin share follow us in feedly line share
Loading...
輝達 Vera Rubin 預計下半年量產,Groq 技術動向將於 GTC 揭露

輝達宣布這週已出貨首批 Vera Rubin 平台樣品,並預計今年下半年開始量產;同時,OpenAI 最新 GPT-5.3 Codex 已在 Grace Blackwell 與 NBL72 系統上完成訓練與推論部署。

今電話會議上,輝達表示 Vera Rubin 採模組化設計,相較 Blackwell 具備更佳韌性與可維修性;在 MOE(Mixture of Experts)模型訓練上可用更少 GPU,並將推論每 token 成本降低最多 10 倍。

在模型合作方面,輝達指出,最近推出的 GPT-5.3 Codex 該模型使用 Grace Blackwell 與 NBL72 系統進行訓練與推論。GPT-5.3 Codex 可處理涉及研究、工具使用與複雜執行的長時間任務,代表 Agentic AI 能力已邁入實用階段。

該模型目前已在輝達內部廣泛部署,工程團隊高度依賴 Codex 協助開發與流程自動化,創辦人暨執行長黃仁勳表示,Agentic AI 的關鍵拐點已到來,前沿模型公司正加速擴張訓練與推論規模,更直言內部工程師「非常喜愛」這套系統。

輝達指出,Physical AI 與邊緣 AI 需求同步成長,Jetson 等嵌入式平台在機器人與自主系統領域持續擴張。隨著資料中心與實體 AI 應用雙線推進,公司正加速布局從訓練、推論到 AI 工廠規模化的完整技術堆疊。

雲端合作亦持續深化。Grace Blackwell 系統已在主要 CSP 與 hyperscaler 中大規模部署,NVLink scale-up 架構成為超大規模 AI 訓練與推論的核心技術。

值得注意的是,輝達亦引入 Groq 的低延遲推論技術與相關工程團隊,並將其整合至 NVIDIA 架構中,進一步提升 AI 基礎設施效能與成本效益。更多進展預計將於下月 GTC 對外揭露,業界預期將為 LPU 與推論市場帶來新一波技術升級。

(首圖來源:NVIDIA

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》