Google 與 NVIDIA 布局低成本推理，重塑 LLM 競爭格局

Google 於 2025 年 12 月底推出 Gemini 3 Flash，主打高速回應、低延遲與高 CP 值，並成為搜尋與應用服務的預設模型，反映其擴大 AI 普及的產品策略。另一方面，輝達（NVIDIA）也透過開放模型 Nemotron 3，主打軟硬體整合與低推理成本。兩者的布局在一定程度上凸顯，未來 LLM 產品將更偏向效率導向與部署成本。

本篇文章將帶你了解 :

Gemini 3 Flash 主打高效率運算，降低部署門檻、提升滲透率

輝達同樣著眼低推理成本，以軟硬整合扮演 AI 生態關鍵角色

從這裡可透過《Google 新聞》追蹤 TechNews