IBM NorthPole AI 晶片整合記憶體架構,稱 12 奈米超越 4 奈米 GPU

作者 | 發布日期 2023 年 10 月 25 日 12:15 | 分類 AI 人工智慧 , IC 設計 , 半導體 line share follow us in feedly line share
IBM NorthPole AI 晶片整合記憶體架構,稱 12 奈米超越 4 奈米 GPU


IBM 日前宣布開發出 NorthPole AI 晶片,號稱具備人類大腦運作,推論性能據稱超越 4 奈米製程的 GPU,適用於邊緣運算等領域。

NorthPole 晶片是 IBM 曾在 2014 年模擬人腦運作的 TrueNorth 晶片後繼款,晶片開發同樣由 TrueNorth 負責人 Dharmendra Modha 主導。

IBM 指出,傳統半導體產業,晶片遵循相同基本架構,處理單元與儲存資訊是相互分開的。這樣的架構雖然簡化晶片設計模式,卻也因傳輸速度趕不上處理速度出現 von Neumann 瓶頸。Dharmendra Modha 認為人腦是最節能處理器,所以研究持續尋找以數位複製人腦的方法。

IBM NorthPole 晶片相對傳統晶片最大不同點是晶片內建記憶體,沒有 von Neumann 瓶頸,NorthPole 晶片 AI 推論能力優於競爭對手。NorthPole 晶片雖然採 12 奈米製程,但能 800mm² 上放置 220 億個電晶體,擁有 256 個核心,於 8-bit 環境每核心運算週期可執行 2,048 次操作,若 4-bit 或 2-bit 環境,執行次數翻倍。

IBM 指出,NorthPole 晶片號稱模糊運算與儲存界線,讓 NorthPole 晶片容易整合至系統,減少搭載晶片設備負荷,讓 NorthPole 晶片在 ResNet-50 模型測試後,結果較同樣採 12 奈米製程對手 GPU 產品來說,NorthPole 晶片每秒辨識能效是對手 25 倍,且不管延遲或運算空間要求,表現都優於所有主流架構,甚至淩駕基於 4 奈米製程的 GPU。

不過 NorthPole 的優勢也是弱點。NorthPole 只能輕鬆讀取整合至晶片的終端數據,讀取外界數據時,便沒有計算速度優勢。Dharmendra Modha 表示,雖然 NorthPole 無法執行類 GPT-4 訓練,但可滿足許多企業模型的推論要求。

IBM 仍在研究 NorthPole 晶片適用領域,但研究員發現,許多需即時處理大量資料的邊緣計算領域將可能非常適合採用 NorthPole 晶片,如自動駕駛、遠端通訊等領域,NorthPole 均是擅長處。

(首圖來源:Flickr/Adrian Scottow CC BY 2.0)