
馬斯克(Elon Musk)旗下 xAI 開始運用位於美國田納西州曼菲斯所謂「曼菲斯超級叢集」,訓練強大的語言模型。
「在單一 RDMA 結構上擁有 10 萬顆液冷 H100,它是世界上最強大的 AI 訓練叢集」,馬斯克在 X 分享曼菲斯超級叢集。「很高興與馬斯克一起創造歷史,與他的曼菲斯團隊合作是一次很棒的經歷!為了達成這個目標,我們的執行必須盡可能完美、盡可能快速、盡可能有效率、盡可能環保。雖然辛苦,但很有意義、令人興奮」,美超微執行長梁見後也在 X 留言表示。
Glad to be making history with @elonmusk, such a great experience to work with his Memphis team! To meet the target, our execution had to be as perfect as possible, as quick as possible, as efficient as possible and as environmentally friendly as possible – lots of hard work, but…
— Charles Liang (@charlesliang) July 22, 2024
根據當地媒體 WREG 報導,曼菲斯超級叢集位於曼菲斯西南部,xAI 將成為該城市歷史上新進入市場的公司中最大筆的投資。值得一提的是,整個曼菲斯超級叢集需要超過 100 MW 電力,xAI 尚未與當地公共事業公司田納西河谷管理局(Tennessee Valley Authority,TVA)簽署用電合約。
馬斯克在回覆 X 更談道,xAI 目標是訓練各項指標最強大的人工智慧,並在今年 12 月之前實現此一目標。
當 OpenAI、Anthropic、微軟、Google、Meta 都在追求更強大、更經濟實惠的大型和小型語言模型,xAI 如果著眼於 AI 競賽中為客戶保持競爭力,那麼該公司需要一個全新、更有用的模型。
值得一提的是,Meta 大規模建設運算基礎設施,預計今年底將包含 35 萬顆 H100 GPU。外媒《The Information》報導透露,微軟和 OpenAI 於美國當地攜手建造一座資料中心,具備容納數百萬顆 GPU、針對 AI 運算最佳化的超級電腦,這項內部稱為「Stargate」的計畫估計花費超過 1,150 億美元。
(首圖來源:Charles Liang)