Google 推出 Gemma 4 開放模型,對抗 Llama、Qwen 搶攻開源 AI 市場

作者 | 發布日期 2026 年 04 月 03 日 10:01 | 分類 AI 人工智慧 , Google line share Linkedin share follow us in feedly line share
Loading...
Google 推出 Gemma 4 開放模型,對抗 Llama、Qwen 搶攻開源 AI 市場

Google 宣布推出新一代開放模型 Gemma 4,主打可讓開發者自行下載與部署,並支援從 Android 裝置到資料中心 GPU 等多種硬體環境,包括 NVIDIA H100。該模型採用 Apache 2.0 授權,有助降低使用門檻並擴大開發者應用。

繼 2024 年 2 月與 5 月分別推出 Gemma 與 Gemma 2,並於 2025 年 3 月發表 Gemma 3 後,Google 持續加快開放模型布局。此次推出 Gemma 4,也被視為其在開源 AI 生態中的最新進展。

Gemma 4 提供多種規模,包括 2B、4B、26B 與 31B 版本,能在不同硬體條件下運行。官方表示,新一代模型在推理與任務處理能力上有所提升,同時兼顧效能與運算效率。該模型亦針對硬體環境進行優化,未經量化的 bfloat16 權重可在單張 80GB 的 NVIDIA H100 GPU 上運行,而量化版本則可部署於消費級 GPU,支援開發者在 IDE、程式輔助工具與代理式(agentic)工作流程中的應用。

在架構設計上,26B 混合專家模型(MoE)著重於降低延遲,在推論時僅啟用部分參數,以提升運算效率與回應速度;而 31B Dense 模型則強調整體輸出品質,並提供更適合進行微調(fine-tuning)的基礎能力。

▲ Gemma 4 模型測試比較圖

在功能方面,Gemma 4 不僅可進行文字與程式碼生成,也支援影像與影片處理,部分模型支援語音輸入。模型同時支援超過 140 種語言,並具備長文本處理能力,適合用於文件分析與多語系應用。

Google 指出,Gemma 4 可在不同裝置上靈活部署,從 Android 裝置、筆電 GPU 到資料中心皆可運行,進一步拓展行動與邊緣 AI 應用場景。

隨著 AI 發展加速,開放模型逐漸成為產業焦點。目前包括 Meta 的 Llama、阿里巴巴的 Qwen 以及 Mistral 等模型皆積極布局,與閉源模型形成競爭。相較之下,開放模型可讓企業自行部署,降低對雲端服務的依賴。

▲ 性能與模型規模比較

(圖片來源:Google

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》