NVIDIA 公布新 Groq 3 推論晶片,由三星代工、預計 Q3 出貨

作者 | 發布日期 2026 年 03 月 17 日 8:25 | 分類 AI 人工智慧 , Nvidia line share Linkedin share follow us in feedly line share
Loading...
NVIDIA 公布新 Groq 3 推論晶片,由三星代工、預計 Q3 出貨

NVIDIA 執行長黃仁勳在 GTC 大會中正式分享新晶片「NVIDIA Groq 3 LPU」,是輝達第一次推出整合 Groq 技術的產品。目前 NVIDIA Groq 3 LPU 將由三星代工,預計第三季出貨。

黃仁勳指出,隨著模型尺寸增加,根據不同應用場景的需求,Token 長度和上下文長度會持續增長,從可能 10 萬個 token 的輸入長度到可能達到百萬,這些因素最終都影響未來 token 的行銷與定價。

他也認為,Token 是新的商品,像所有商品一樣,一旦到達拐點,隨著成熟與否將分成不同層級,如高吞吐、低速度的,可用於免費方案;下一層級可能是中等方案;更大的模型速度一定更高。他也透露,有些可能是免費方案、下一階段是每百萬 Token 3 美元、再接下去是每百萬 Token 6 美元,未來出現每百萬 Token 150 美元的方案也就不足為奇了。

從客戶角度來看,如果將所有資源分配,其中 25% 用於免費層,25% 用於中等層,25% 用於高層,25% 用於高級層,當資料中心只有一吉瓦時,就可以決定如何分配。也因此,隨著新產品不斷迭代,相比 BlackwellVera Rubin 能創造 5 倍收入。

黃仁勳表示,若大部分工作負載是高吞吐,會全力 Vera Rubin 產品;若需要編碼或高價值工程 Token 生成,會將 Groq 加入,約 25% 數據中心使用  Groq,其餘 100% Vera Rubin。而這個工作負載正是 AI 工廠的工作負載,隨著全球生成更多高速、高智慧 token,這整合的價值將更高。

目前 NVIDIA Groq 3 LPU 將由三星代工,預計第三季出貨。

(首圖來源:NVIDIA)

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》