Google 第七代 Ironwood TPU 全面供應，擴充 Axion CPU 組合

Google 專為 AI 運算量身打造的 TPU（Tensor Processing Unit）已經來到第七代「Ironwood」，將在未來數週內全面供應客戶使用。

使用 Ironwood，Google 可在單一 Pod 擴展至 9,216 顆晶片，並以突破性的晶片間互連（Inter-Chip Interconnect，ICI）網路達到 9.6 Tb/s 傳輸速度。這允許數千顆晶片快速互連並存取高達 1.77 PB 的共享高頻寬記憶體（HBM），即使是最高要求的模型也能克服數據瓶頸。這也意味著 Ironwood 的 Pod 在 FP8 精度下，可比第二接近的競爭對手多 118 倍的 ExaFLOPS。

在這種規模下，服務需要不間斷的可用性。因此 Google 的光學電路交換（Optical Circuit Switching，OCS）技術作為一種動態、可重新配置的網路機制，能即時繞過中斷來恢復工作負載，確保服務持續運行。當需要更多算力時，Ironwood 可跨 Pod 擴展至數十萬顆 TPU 的叢集。

Google 以多年經驗開發出整合式 AI Hypercomputer 架構，無縫整合 AI 工作負載所需的軟硬體。TPU 已是 AI Hypercomputer 的關鍵元件，接著將由 Ironwood 接下重任。

值得一提的是，Anthropic 日前宣布擴大使用 Google Cloud 的技術，其中 TPU 用量擴充至 100 萬顆，加速他們從訓練 Claude 模型到為數百萬用戶提供服務的進程。Anthropic 正在對 Ironwood 進行測試，「Ironwood 在推理性能和訓練方面的改進有效擴展整個規模，同時保持客戶期望的速度和可靠性」，Anthropic 運算部門傑出工程師 James Bradbury 表示。