超越全球最大 7 奈米晶片 A100!Graphcore 第二代 IPU 電晶體數量高達 594 億個

作者 | 發布日期 2020 年 07 月 16 日 14:50 | 分類 晶片 , 處理器 , 零組件 line share follow us in feedly line share
超越全球最大 7 奈米晶片 A100!Graphcore 第二代 IPU 電晶體數量高達 594 億個


總部位於英國的 AI 晶片公司 Graphcore 15 日發布了第二代 IPU GC200,採用台積電 7 奈米製程,電晶體數量高達 594 億個,裸片面積達到 823 平方毫米。這比 2 個月前輝達(NVIDIA)最新發布的安培架構 GPU A100 的 540 億個電晶體增加了 10%,黃仁勳當時說 A100 是全球最大的 7 奈米晶片,裸片面積為 826 平方毫米。

IPU 是一種全新的大規模並行處理器,先前已經推出了基於台積電 16 奈米製程整合 236 億個電晶體的 GC2 IPU,120 瓦的功耗下有 125TFlops 的混合精度、300M 的 SRAM 能夠把完整的模型放在晶片內。

(Source:Graphcore

第二代 IPU GC2000(MK2)與第一代 IPU(MK1)相比,實際性能提高了 8 倍。Graphcore 聯合創始人兼 CEO Nigel Toon 表示,GC200 是目前世界上最複雜的處理器,可使創新者實現 AI 的革命性突破。

▲ Mk1 IPU 產品與 Mk2 IPU 產品性能對比。(Source:Graphcore,下同)

據悉,GC2000 晶片內部有 1,472 個獨立的處理器核心,能夠執行 8,832 個獨立的並行線程,所有這些均由 900MB 的 RAM 支援。

Nigel 說:「GC200 在處理器內部具有史無前例的 900MB 超高速 SRAM,在每個處理器內核旁邊都設有大量 RAM,以實現每位最低能量的使用。Graphcore 的 Poplar 軟體還允許 IPU 透過 Graphcore 獨特的 Exchange-Memory 通訊 Streaming Memory。這甚至可以支援具有數千億個參數的最大模型。每個 IPU-M2000 都可以支援密度高達 450GB 的 Exchange-Memory,以及前所未有的 180TB/秒的頻寬。」

Graphcore IPU-Fabric技術

▲ Graphcore IPU-Fabric 技術。

除此之外,基於最新 GC200 的一款即插即用的機器智慧刀鋒計算結構 IPU-M2000 還整合了 Graphcore 的專用 AI 聯網 IPU-Fabric。新的 Graphcore GC4000 IPU-Gateway 晶片可以讓每個 IPU-M2000 提供 2.8Tbps。Graphcore 稱,在從數十個 IPU 擴展到數以萬計個 IPU 的過程中,IPU-Fabric 技術使通訊時延幾乎保持恆定。

據悉,1U 大小的 IPU-M2000 可提供 1 個 PetaFlop 的機器智慧計算。利用 IPU-M2000 可構建成 IPU-POD64 的模組化機架規模解決方案。IPU-M2000 的設計使客戶可以在 IPU-POD 配置中構建多達 64,000 個 IPU 的資料中心規模系統,提供 16ExaFlops 的機器智慧計算能力。

(Source:影片截圖,下同)

Graphcore 也強調,其 Poplar SDK 可以使開發者無論使用單個 IPU 還是要使用數千個 IPU 完成機器智慧工作負載都可以讓過程變得簡單。

Graphcore 高級副總裁兼中國區總經理盧濤表示,中國很可能成為 Graphcore 最新推出的第二代處理器技術最先實現商業化落地的區域之一。

(本文由 雷鋒網 授權轉載;首圖來源:Graphcore

延伸閱讀: