Google 與 NVIDIA 布局低成本推理,重塑 LLM 競爭格局

作者 | 發布日期 2026 年 01 月 05 日 7:00 | 分類 AI 人工智慧 , Gemini , Google line share Linkedin share follow us in feedly line share
Loading...
Google 與 NVIDIA 布局低成本推理,重塑 LLM 競爭格局

Google 於 2025 年 12 月底推出 Gemini 3 Flash,主打高速回應、低延遲與高 CP 值,並成為搜尋與應用服務的預設模型,反映其擴大 AI 普及的產品策略。另一方面,輝達(NVIDIA)也透過開放模型 Nemotron 3,主打軟硬體整合與低推理成本。兩者的布局在一定程度上凸顯,未來 LLM 產品將更偏向效率導向與部署成本。

本篇文章將帶你了解 :
  • Gemini 3 Flash 主打高效率運算,降低部署門檻、提升滲透率
  • 輝達同樣著眼低推理成本,以軟硬整合扮演 AI 生態關鍵角色