支援 Gemini 2.0 模型訓練和推理,第六代 Trillium TPU 供客戶使用

作者 | 發布日期 2024 年 12 月 12 日 7:57 | 分類 AI 人工智慧 , Google , 晶片 line share Linkedin share follow us in feedly line share
Loading...
支援 Gemini 2.0 模型訓練和推理,第六代 Trillium TPU 供客戶使用

今年 Google I/O 2024 開發者大會,Google 發表第六代 TPU──Trillium,是該公司至今最高性能且最節能的 TPU。Trillium 則幫助 Google 推動 Gemini 2.0,支援新模型訓練和推理。

Trillium 這款客製化加速器為 Google 新發表 Gemini 2.0 模型的訓練和推理提供 100% 支援,訓練性能提升超過 4 倍,現在 Trillium 正式提供給 Google Cloud 客戶使用。

與上一款 TPU v5e 相比,Trillium 每一晶片峰值計算效能提升 4.7 倍,Google 將其高頻寬記憶體(High Bandwidth Memory,HBM)容量加倍,晶片間互連網路(Interchip Interconnect,ICI)頻寬也加倍。

不只如此,Trillium 能源效率比 TPU v5e 高出 67%,這是資料中心面對 AI 訓練產生龐大用電需求的重要指標,凸顯減少能源消耗。Trillium 每美元的訓練性能提升 2.5 倍,每美元的推理性能也提升 1.4 倍。

Trillium 部署規模也是前所未有,Google 在 Jupiter 網路架構連接超過 10 萬個 Trillium,希望打造世界上最強大的 AI 超級電腦。

AI 軍備競賽如火如荼,其中 NVIDIA 憑藉其 GPU 及解決方案在市場占有主導地位。雖然 NVIDIA 晶片仍是許多 AI 應用的產業標準,然而 Trillium 這樣的客製化加速器在特定工作負載具優勢,特別是訓練大型語言模型更能顯現性能、減少成本。

(首圖來源:Google Blog

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》