超越全球最大 7 奈米晶片 A100！Graphcore 第二代 IPU 電晶體數量高達 594 億個

總部位於英國的 AI 晶片公司 Graphcore 15 日發布了第二代 IPU GC200，採用台積電 7 奈米製程，電晶體數量高達 594 億個，裸片面積達到 823 平方毫米。這比 2 個月前輝達（NVIDIA）最新發布的安培架構 GPU A100 的 540 億個電晶體增加了 10%，黃仁勳當時說 A100 是全球最大的 7 奈米晶片，裸片面積為 826 平方毫米。

IPU 是一種全新的大規模並行處理器，先前已經推出了基於台積電 16 奈米製程整合 236 億個電晶體的 GC2 IPU，120 瓦的功耗下有 125TFlops 的混合精度、300M 的 SRAM 能夠把完整的模型放在晶片內。

（Source：Graphcore）

第二代 IPU GC2000（MK2）與第一代 IPU（MK1）相比，實際性能提高了 8 倍。Graphcore 聯合創始人兼 CEO Nigel Toon 表示，GC200 是目前世界上最複雜的處理器，可使創新者實現 AI 的革命性突破。

▲ Mk1 IPU 產品與 Mk2 IPU 產品性能對比。（Source：Graphcore，下同）

據悉，GC2000 晶片內部有 1,472 個獨立的處理器核心，能夠執行 8,832 個獨立的並行線程，所有這些均由 900MB 的 RAM 支援。

Nigel 說：「GC200 在處理器內部具有史無前例的 900MB 超高速 SRAM，在每個處理器內核旁邊都設有大量 RAM，以實現每位最低能量的使用。Graphcore 的 Poplar 軟體還允許 IPU 透過 Graphcore 獨特的 Exchange-Memory 通訊 Streaming Memory。這甚至可以支援具有數千億個參數的最大模型。每個 IPU-M2000 都可以支援密度高達 450GB 的 Exchange-Memory，以及前所未有的 180TB/秒的頻寬。」

Graphcore IPU-Fabric技術

▲ Graphcore IPU-Fabric 技術。

除此之外，基於最新 GC200 的一款即插即用的機器智慧刀鋒計算結構 IPU-M2000 還整合了 Graphcore 的專用 AI 聯網 IPU-Fabric。新的 Graphcore GC4000 IPU-Gateway 晶片可以讓每個 IPU-M2000 提供 2.8Tbps。Graphcore 稱，在從數十個 IPU 擴展到數以萬計個 IPU 的過程中，IPU-Fabric 技術使通訊時延幾乎保持恆定。

據悉，1U 大小的 IPU-M2000 可提供 1 個 PetaFlop 的機器智慧計算。利用 IPU-M2000 可構建成 IPU-POD64 的模組化機架規模解決方案。IPU-M2000 的設計使客戶可以在 IPU-POD 配置中構建多達 64,000 個 IPU 的資料中心規模系統，提供 16ExaFlops 的機器智慧計算能力。