Google 打造第八代 TPU 兩款晶片,推 Gemini Enterprise 代理平台

作者 | 發布日期 2026 年 04 月 22 日 20:00 | 分類 AI 人工智慧 , Google , 伺服器 line share Linkedin share follow us in feedly line share
Loading...
Google 打造第八代 TPU 兩款晶片,推 Gemini Enterprise 代理平台

Google Cloud Next 2026 大會 22 日將在美國拉斯維加斯正式登場,首日主題演講在稍晚舉行。Google Cloud 將宣布一系列創新技術,包含全新統一的 AI 技術堆疊、第八代 TPU(Tensor Processing Unit),以及各種橫跨數據、資安及生產力的代理式技術創新,協助各種規模的企業擁抱代理式 AI 能力,轉型成「代理式企業」。

運算晶片

晶片被視為 AI 基礎設施一大關鍵,Google Cloud 擁有自行研發的 TPU,如今來到第八代——TPU 8t 和 TPU 8i,具備專為訓練、推理打造 2 種截然不同架構,從建立強大 AI 模型,再到完美調度龐大 Agent,以及管理最複雜的推理任務,第八代 TPU 均扮演關鍵角色。

TPU 8t 經過最佳化處理後如同訓練效能引擎,可將先進模型的開發時間從數個月縮短至數週。為實現這個目標,Google Cloud 透過一個系統平衡了極致的運算吞吐量、共享記憶體及晶片間頻寬,同時提供最佳的能源效率和高產能的運算時間。

TPU 8i 作為推理引擎,專為驅動代理式 AI(Agentic AI)使用體驗而打造。只需要提出問題、將任務委派給 Agent,就能立即獲得回應,無需等待數秒以上。它結合 288 GB 高頻寬記憶體,與內建 384 MB 靜態隨機存取記憶體(SRAM),容量較上一代增加 3 倍,能將模型使用中的工作集完全保存在晶片上。

與第七代 Ironwood TPU 相比,第八代的效益提升 80%,使企業能以相同的成本服務近乎雙倍的顧客量,幫助實現獲利成長。Google Cloud 表示,這 2 款晶片將在今年稍晚正式提供給客戶。

▲ 分別為訓練效能與推理打造的 TPU 8t(圖左) 和 TPU 8i(圖右)。

其他包括:

  • A5X 裸機執行個體:由 NVIDIA Vera Rubin NVL72 驅動。
  • Axion N4A 虛擬機器:由 Google Cloud 自行研發、以 Arm 架構為基礎的 Axion CPU 驅動。
  • Google Compute Engine 第四代虛擬機器:由英特爾和 AMD x86 架構 CPU 驅動。
  • Virgo Network:是為 AI 工作負載量身打造的突破性資料中心網路結構。

值得一提的是,有了 Virgo Network 和 TPU 8t,Google Cloud 可在單一資料中心內將 13.4 萬顆 TPU 連接為單一網路結構,跨越多座資料中心把超過 100 萬顆 TPU 連接成訓練叢集。Google Cloud 也將 Virgo Network 提供給由 NVIDIA Vera Rubin NVL72 驅動的 A5X 使用,可在單一資料中心內支援多達 8 萬顆 GPU,並在橫跨多座據點支援多達 96 萬顆 GPU。

代理平台

Gemini Enterprise 是 Google Cloud 專為代理式時代所打造的端到端系統,連結企業資料、人員以及所有應用程式和 Agent 的樞紐,將所有營運流程轉變為單一的智慧工作流程。

這次大會,Google Cloud 將推出 Gemini Enterprise Agent Platform,這是一個專為建立、擴充、治理及最佳化 Agent 所打造的全方位平台。作為 Vertex AI 平台的進化版,它整合原有的模型選擇、模型建立及 Agent 建立功能,並加入針對 Agent 整合、開發運作(DevOps)、調度(orchestration)及安全的全新功能。

Gemini Enterprise Agent Platform 為技術團隊提供一站式開發環境以打造 Agent,進而改變企業的產品、服務及營運。這些 Agent 將透過 Gemini Enterprise 應用程式無縫交給員工使用,同時與 IT 營運保持緊密整合,協助企業在擴展規模的同時確保控制權、資料治理及安全性。

Gemini Enterprise Agent Platform 也透過 Model Garden 提供全球 200 多個領先模型的優先存取權限,包括 Google 自家 Gemini 3.1 Pro、Gemini 3.1 Flash Image 及 Lyria 3。客戶也能透過平台所支援的 Claude Opus / Sonnet / Haiku 等第三方模型,針對不同任務選擇最適合的模型,Google 也宣布會支援 Anthropic 最新 Claude Opus 4.7 模型。

資安防護

Google Cloud 將推出由 AI 驅動的網路安全平台,整合 Google 威脅情報(Google Threat Intelligence)和資安營運平台(SecOps),以及 Wiz 的雲端和 AI 資安平台,協助企業在各種環境預防、偵測並回應威脅。

許多客戶已體驗過分類與調查 Agent(Triage and Investigation Agent)帶來的效益,例如至今處理超過 500 萬則警報,並透過 Gemini 將通常需要 30 分鐘的人工手動分析時間大幅縮短至只需 60 秒。

為進一步落實多雲安全承諾,Wiz 支援 Databricks 以及多款新型的 AI 代理平台 (agent studios),像是 AWS AgentCore、Gemini Enterprise Agent Platform、Microsoft Azure Copilot Studio 及 Salesforce Agentforce。

此外,Google Cloud 在 Google Security Operations 推出 3 款全新 Agent,協助企業進行防禦:

  • 暗網情報(Dark Web Intelligence):結合 Google 威脅情報小組的暗網專業知識,並使用最新 Gemini 模型,為企業建立細緻的風險概況。
  • 威脅搜索 Agent(Threat Hunting Agent):利用 Google 龐大的威脅情報知識庫,讓資安團隊能夠主動搜索繞過傳統防禦機制的新型攻擊模式與攻擊者行為。
  • 偵測工程 Agent(Detection Engineering Agent):為各種威脅情境生成持續性的偵測規則,並將偵測規則的建立從原先耗時的手動技術活,轉變為高效的自動化流程。

為確保代理式網路(Agentic Web)安全,reCAPTCHA 演進升級為 Google Cloud 詐欺防禦(Google Cloud Fraud Defense)。這個全方位的平台全面推出,專為辨識機器人、真人及 Agent 的合法性和授權狀態而設計。Google Cloud 詐欺防禦採用與保護 Google 自身生態系相同規模與訊號技術,近期將推出針對真人使用者和 Agent 的專屬功能預覽版,協助保護從帳戶建立、登入到支付結帳的完整數位商務流程。

Google Cloud 指出,近 75% 客戶使用其 AI 產品來驅動業務發展。在過去 12 個月,有 330 家客戶各自處理超過 1 兆 token,其中 35 家客戶透過 Google Cloud 的模型在應用程式中達成 10 兆 token 使用里程碑。現在,客戶透過直接使用 API,讓第一方模型每分鐘處理超過 160 億 token,高於上一季的 100 億 token。

▲ Next ’26 大會首日主題演講。

(圖片來源:Google Cloud)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》