由 4,608 個 H100 驅動!Nvidia 首度公開最快 AI 超級電腦 Eos

作者 | 發布日期 2024 年 02 月 16 日 11:28 | 分類 AI 人工智慧 , 晶片 , 電腦 line share follow us in feedly line share
由 4,608 個 H100 驅動!Nvidia 首度公開最快 AI 超級電腦 Eos


Nvidia 週四(15 日)首度公開最新面向企業的超級電腦 Eos 的架構,Eos 是專為資料中心規模的高階 AI 開發所設計,也是該公司速度最快的 AI 超級電腦。

Eos 擁有 4,608 個 Nvidia H100,是目前世界上性能排名第九的超級電腦。在最新前 500 超級電腦榜單中,Eos 以 FP64 為衡量標準脫穎而出,在純 AI 任務中性能更是居於前列。Eos 不僅供 Nvidia 自身使用,其架構也為其他想打造面向企業的超級電腦的公司提供藍本。

Nvidia 在影片中表示,Eos 每日迎接數千名 Nvidia 內部開發人員的 AI 挑戰,幫助他們解決以前無法解決的問題。

Eos 配置 576 個 DGX H100 系統,每個系統搭載 8 個 H100 GPU,配合 1,152個英特爾 Xeon Platinum 8480C 處理器(每個 CPU 有56 個內核)和 4,608 個 H100 GPU,使 Eos 在 HPC 和 AI 的性能表現令人印象深刻。此外,Eos 採用 Nvidia 的 Mellanox Quantum-2 InfiniBand 技術,支持高達 400 Gb/s 數據傳輸速度,對訓練大型 AI 模型和系統擴展至關重要。

Nvidia 表示,除強大硬體,Eos 專為 AI 開發和部署設計的強大軟體,包括協調和集群管理工具、加速運算存儲和網路庫,以及優化的操作系統。也因此,Eos 可應對從類似 ChatGPT 生成式 AI 到 AI 工廠等各種應用。

Nvidia 強調,Eos 整合 Nvidia 在 AI 領域的專業技術和經驗,是先前 DGX 超級電腦知識的結晶,幫助企業處理最具挑戰性的專案,並實現 AI 目標。

儘管 Eos 具體成本未公開,且 Nvidia DGX H100 系統定價是保密的,取決於很多因素,但考慮到每個 H100 成本可能在 3 萬至 4 萬美元之間,因此整個系統成本可能非常高昂。

(首圖來源:Nvidia

延伸閱讀: