NVIDIA H100 GPU 的 MLPerf 標準測試創紀錄,證明無可替代

作者 | 發布日期 2023 年 11 月 09 日 10:30 | 分類 AI 人工智慧 , GPU , 半導體 line share follow us in feedly line share
NVIDIA H100 GPU 的 MLPerf 標準測試創紀錄,證明無可替代


生成式 AI 爆紅後,許多廠商積極推出產品,企圖分食市場。而人工智慧晶片王者 NVIDIA,日前宣布 H100 GPU 的 MLPerf 標準測試又創造新紀錄,顯示 NVIDIA 身為龍頭的實力。

NVIDIA 最新 MLPerf 標準測試,Eos 超級電腦短短 3.9 分鐘內,完成 10 億個程式碼訓練 1,750 億個參數的 GPT-3 模型訓練基準,較上版 10.9 分鐘完成相同標準測試,速度提升 3 倍,堪稱跳躍式進步。

H100 GPU 成績如此驚人,首先 NVIDIA 頂尖 Hopper GPU 架構與完善軟體資源結合,標準測式 Eos 超級電腦採 10,752 個 NVIDIA H100 Tensor Core GPU,取代舊款 A100,是效能大幅提升的主因。開發完善的軟體資源,有助 LLM 培訓的 NVIDIA NeMo,更從平台榨出驚人能量。

另一項創紀錄成就,是系統擴展進步,透過各種軟體幫助,達成提升 93% 效率。配備 10,752 個 H100 GPU 的超級電腦達到以往花六個月訓練 AI 的效能。NVIDIA 使用 3,584 個 Hopper GPU,顯示高效擴展非常重要。實現高運算能力需更多硬體資源,但如果沒有軟體支援,系統效率也會大受影響。

(首圖來源:NVIDIA)