Google 推出 Gemma 4 開放模型，對抗 Llama、Qwen 搶攻開源 AI 市場

Google 宣布推出新一代開放模型 Gemma 4，主打可讓開發者自行下載與部署，並支援從 Android 裝置到資料中心 GPU 等多種硬體環境，包括 NVIDIA H100。該模型採用 Apache 2.0 授權，有助降低使用門檻並擴大開發者應用。

繼 2024 年 2 月與 5 月分別推出 Gemma 與 Gemma 2，並於 2025 年 3 月發表 Gemma 3 後，Google 持續加快開放模型布局。此次推出 Gemma 4，也被視為其在開源 AI 生態中的最新進展。

Gemma 4 提供多種規模，包括 2B、4B、26B 與 31B 版本，能在不同硬體條件下運行。官方表示，新一代模型在推理與任務處理能力上有所提升，同時兼顧效能與運算效率。該模型亦針對硬體環境進行優化，未經量化的 bfloat16 權重可在單張 80GB 的 NVIDIA H100 GPU 上運行，而量化版本則可部署於消費級 GPU，支援開發者在 IDE、程式輔助工具與代理式（agentic）工作流程中的應用。

在架構設計上，26B 混合專家模型（MoE）著重於降低延遲，在推論時僅啟用部分參數，以提升運算效率與回應速度；而 31B Dense 模型則強調整體輸出品質，並提供更適合進行微調（fine-tuning）的基礎能力。