輝達 GH200 登場,黃仁勳:AI 模型執行成本將大降

作者 | 發布日期 2023 年 08 月 09 日 9:35 | 分類 AI 人工智慧 , 半導體 , 晶片 line share follow us in feedly line share
輝達 GH200 登場,黃仁勳:AI 模型執行成本將大降


為抵禦超微(AMD)、Google 及亞馬遜(Amazon.com)在人工智慧(AI)硬體領域的競爭,輝達(Nvidia Corp.)新推了專門用來執行 AI 模型的全新晶片,並表示執行大型語言模型(LLMs)的成本將「顯著降低」。

CNBC、MarketWatch等外電報導,輝達執行長黃仁勳(Jensen Huang)8日在2023年繪圖盛會「SIGGRAPH」(Special Interest Group on Computer Graphics and Interactive Techniques)發表次世代超級晶片「DGX GH200 Grace Hopper Superchip」,主要應用於大型記憶體生成式AI模型,例如OpenAI的AI聊天機器人「ChatGPT」。

GH200的Hopper繪圖處理器(GPU)與輝達目前最高階AI晶片「H100」相同,但結合72核心的ARM架構Grace中央處理器(CPU),並搭配141 GB HBM3記憶體及每秒5 TB頻寬。另外,NVLink-dual GH200系統內建兩顆GH200,可將容量擴充3.5倍、頻寬增加三倍。

黃仁勳8日表示,這款升級過後的處理器專門應用於全世界最大資料中心的水平式擴充(scale-out)作業。

GH200預定2024年第二季上市,但輝達並未說明定價。黃仁勳僅指出,GH200可讓大型語言模型的推論成本顯著下降。

AI模型的工作過程可分為兩部分:訓練與推論(inference)。

首先,AI模型會以大量資料訓練,過程可能花上數月,有時需要上千顆GPU,例如輝達的H100及A100晶片。之後,AI模型將被軟體用來預測或產生內容,這個過程稱做推論。如同訓練,推論過程相當昂貴,軟體每次產生文字或內容都需要許多算力。然而,AI模型只有在更新時才需要訓練,推論卻會持續不斷發生。

輝達副總裁Ian Buck 8日在電話會議表示,最新的GH200專為推論設計,因為這個程序需要更多記憶體容量,可讓更大型的AI模型置入單一系統。

Buck指出,記憶體容量加大,可讓AI模型常駐單一GPU,執行時不再需要多個系統或多顆GPU來配合。

輝達8日股價終場下跌1.66%、收446.64美元;盤中一度在新產品發表後下挫最多3%。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:輝達