甲骨文(Oracle)宣布推出首個 Zettascale(十垓,10²¹ 次方)級雲端運算叢集,採輝達(Nvidia Corp.)次世代「Blackwell」平台。與此同時,甲骨文並透露,已取得三座小型模組化反應爐(Small Modular Reactor,簡稱 SMRs、小型核電廠)的建照,準備供應 AI 資料中心所需。
甲骨文11日新聞稿宣布,「甲骨文雲端基礎架構」(Oracle Cloud Infrastructure,OCI)現在開始接受雲端大型AI超級電腦訂單,能組建涵蓋最多131,072顆Blackwell GPU的運算叢集,峰值算力高達前所未見的2.4zettaFLOPS。
甲骨文指出,OCI超級叢集(OCI Supercluster)規模最大的款式,提供的繪圖處理器(GPU)數量是Frontier超級電腦(配備37,888顆AMD Instinct MI250X GPU)三倍以上,更是其他大型雲端服務商(Hyperscaler)的超過六倍。
OCI超級叢集目前能供訂購的OCI運算組態,有輝達H100或H200 Tensor Core GPU或輝達Blackwell GPU可選。
配備H100 GPU的OCI超級叢集最多可拓展至16,384顆GPU、提供高達65ExaFLOPS算力和13Pb/s的總網絡吞吐量。配備H200 GPU的OCI超級叢集最多可拓展至65,536顆GPU、提供最多260ExaFLOPS的算力和52Pb/s的總網絡吞吐量,預計今年稍晚推出。
另外,配備輝達GB200 NVL72液冷裸機伺服器的OCI超級叢集,將透過NVLink和NVLink Switch技術,讓最多72顆Blackwell GPU以129.6 TB/s的總頻寬在同一NVLink域內互聯。輝達Blackwell GPU預定2025年上半年供貨。
Tom′s Hardware、The Register等外電報導,甲骨文創辦人兼董事長、科技長Larry Ellison 9日在財報電話會議表示,已取得三座SMR建照,滿足AI資料中心對電力的需求。
SMR是迷你版的核子反應爐,可以大量生產,不需要大型實體基礎建設。理論上,SMR營運起來較不昂貴,但仍可產生數十至數百MW(百萬瓦)的電力。不過,目前並無實際開始運作的SMR,試營運也不太順利。
甲骨文希望拓展資料中心業務,對SMR相當感興趣。Ellison 9日透過電話會議說,甲骨文全世界有162座雲端資料中心,有些開始運作、有些還在建造。規模最大者為800MW,配備許多輝達GPU叢集,能夠訓練全球規模最大的AI模型。Ellison並表示,甲骨文很快就能建造規模超過1GW的資料中心。