可在 AI PC 運行,Google 發表輕量級開源模型「Gemma」

作者 | 發布日期 2024 年 02 月 22 日 21:09 | 分類 AI 人工智慧 , Google line share follow us in feedly line share
可在 AI PC 運行,Google 發表輕量級開源模型「Gemma」


Google 採用與建立 Gemini 模型相同的技術和技術和基礎架構元件,開發出輕巧、開源的新模型 Gemma,可在筆電、工作站等電腦,或者 Google Cloud 上執行。

Google 目前為 Gemma 推出兩種規模:20 億參數的 Gemma 2B 和 70 億參數的 Gemma 7B,每種規模皆發表預先訓練和指令調整的版本,以利開發者和企業客戶進行研究和開發。

Gemma 由 Google DeepMind 和 Google 旗下其他團隊聯手開發,新模型開發靈感來自 Gemini,名稱則參考拉丁文 gemma,意即「寶石」。

值得關注的是,為了發揮模型性能,Google 與 NVIDIA 攜手合作,從資料中心到雲端再到搭載 RTX 系列顯卡的 AI PC,針對 Gemma 在 NVIDIA GPU 上的效能表現進行最佳化。

開發者可以針對文字生成、內容摘要、問答等輕量級任務,運用 Gemma 建構生成式 AI 應用程式;或者使用自訂的輕量級 Gemma 進行探索和實驗,以支援研發作業;還能將 Gemma 支援需要低延遲的即時生成式 AI 應用場景,比方說串流文字。

▲ iKala 執行長程世嘉針對 Gemma 提出個人見解,認為 Google 藉 Gemini、Gemma 企圖複製 Android 的成功戰略。

Gemma 支援 Google Cloud 開發者愛用的工具,包括 Colab 和 Kaggle Notebooks,以及 JAX、PyTorch、 Keras 3.0 和 Hugging Face Transformers 等框架。現在 Google Cloud 的客戶可在 Vertex AI 開始運用 Gemma,並於 Google Kubernetes Engine(GKE)當中執行。

繼上週發表 Gemini 1.5 後,緊接著釋出兩種規模的 Gemma,這也是自 OpenAI 推出 ChatGPT、掀起全球 AI 熱潮以來,Google 首次發表開源大型語言模型。然而這並非 Google 對開源 AI 研究的首次貢獻,事實上 Google 將 Transformer 架構的開發以及 TensorFlow、BERT、T5、JAX 等版本視為關鍵貢獻,這些技術毫無疑慮對 AI 發展相當重要。

(首圖來源:Google Blog