總部位於英國的 AI 晶片公司 Graphcore 15 日發布了第二代 IPU GC200,採用台積電 7 奈米製程,電晶體數量高達 594 億個,裸片面積達到 823 平方毫米。這比 2 個月前輝達(NVIDIA)最新發布的安培架構 GPU A100 的 540 億個電晶體增加了 10%,黃仁勳當時說 A100 是全球最大的 7 奈米晶片,裸片面積為 826 平方毫米。
IPU 是一種全新的大規模並行處理器,先前已經推出了基於台積電 16 奈米製程整合 236 億個電晶體的 GC2 IPU,120 瓦的功耗下有 125TFlops 的混合精度、300M 的 SRAM 能夠把完整的模型放在晶片內。
(Source:Graphcore)
第二代 IPU GC2000(MK2)與第一代 IPU(MK1)相比,實際性能提高了 8 倍。Graphcore 聯合創始人兼 CEO Nigel Toon 表示,GC200 是目前世界上最複雜的處理器,可使創新者實現 AI 的革命性突破。
▲ Mk1 IPU 產品與 Mk2 IPU 產品性能對比。(Source:Graphcore,下同)
據悉,GC2000 晶片內部有 1,472 個獨立的處理器核心,能夠執行 8,832 個獨立的並行線程,所有這些均由 900MB 的 RAM 支援。
Nigel 說:「GC200 在處理器內部具有史無前例的 900MB 超高速 SRAM,在每個處理器內核旁邊都設有大量 RAM,以實現每位最低能量的使用。Graphcore 的 Poplar 軟體還允許 IPU 透過 Graphcore 獨特的 Exchange-Memory 通訊 Streaming Memory。這甚至可以支援具有數千億個參數的最大模型。每個 IPU-M2000 都可以支援密度高達 450GB 的 Exchange-Memory,以及前所未有的 180TB/秒的頻寬。」
▲ Graphcore IPU-Fabric 技術。
除此之外,基於最新 GC200 的一款即插即用的機器智慧刀鋒計算結構 IPU-M2000 還整合了 Graphcore 的專用 AI 聯網 IPU-Fabric。新的 Graphcore GC4000 IPU-Gateway 晶片可以讓每個 IPU-M2000 提供 2.8Tbps。Graphcore 稱,在從數十個 IPU 擴展到數以萬計個 IPU 的過程中,IPU-Fabric 技術使通訊時延幾乎保持恆定。
據悉,1U 大小的 IPU-M2000 可提供 1 個 PetaFlop 的機器智慧計算。利用 IPU-M2000 可構建成 IPU-POD64 的模組化機架規模解決方案。IPU-M2000 的設計使客戶可以在 IPU-POD 配置中構建多達 64,000 個 IPU 的資料中心規模系統,提供 16ExaFlops 的機器智慧計算能力。
(Source:影片截圖,下同)
Graphcore 也強調,其 Poplar SDK 可以使開發者無論使用單個 IPU 還是要使用數千個 IPU 完成機器智慧工作負載都可以讓過程變得簡單。
Graphcore 高級副總裁兼中國區總經理盧濤表示,中國很可能成為 Graphcore 最新推出的第二代處理器技術最先實現商業化落地的區域之一。