重押 LPU 補齊推論短板,NVIDIA 收編 Groq 強化低延遲推論版圖

作者 | 發布日期 2026 年 01 月 14 日 7:00 | 分類 AI 人工智慧 , Nvidia , 公司治理 line share Linkedin share follow us in feedly line share
Loading...
重押 LPU 補齊推論短板,NVIDIA 收編 Groq 強化低延遲推論版圖

NVIDIA 於 2025 年 12 月 24 日宣布,與 AI 新創 Groq 以 200 億美元達成非獨家推論技術授權協議,並延攬 Groq 創辦人 Jonathan Ross 與核心團隊加入。NVIDIA 採「授權+挖角」類併購(Acqui-hire)手法,重點不在買下廠商本體,而是把超低延遲推論能力與關鍵人才納入 NVIDIA 版圖,加速從訓練霸主轉向推論平台的規則制定者。

本篇文章將帶你了解 :
  • SRAM不會取代HBM:SRAM強攻Decode延遲、HBM負責Prefill容量
  • NVIDIA類併購目的:守住推論定價權,並把客戶留在自家平台生態系