在最近的討論中,業界專家指出,儘管人工智慧(AI)系統的需求持續上升,但高效能運算(HPC)的需求卻似乎在下降。這引發了關於 AI 是否正在取代 HPC 的爭論。然而,許多專家認為,這種觀點是錯誤的,因為 AI 實際上是 HPC 的一個子集,而非其替代品。
高效能運算並不是一個單一應用或技術領域,而是一個涵蓋多個領域的廣泛術語,包括金融服務、製藥、製造等。這些工作負載因其複雜性和運算需求而需要大量的時間和資金投入。AI雖然在近年來獲得了爆炸式增長,但它仍然屬於HPC的範疇。
AI和傳統HPC工作流都需要高效能的基礎設施來滿足解決方案的時間和準確性要求。雖然可以在普通的筆記型電腦上運行某些應用,但所需的時間和資源將使結果變得不具相關性。隨著對更高準確性和更大問題的需求不斷增加,HPC和AI都需要不斷擴展其運算能力。
有些人可能會認為,AI使用加速器如GPU,而許多HPC應用則不使用,因此它們是不同的。然而,HPC並不是一個特定的應用,而是一個涵蓋多種技術運算的領域。許多HPC的使用者可能不會使用HPC這個術語來描述他們的工作,但他們的應用和設備仍然是HPC類型的。
隨著AI技術的進步,未來幾乎所有的應用和工作流都將融入AI。從藥物發現到製造業,AI將被整合到傳統的HPC應用中。此外,許多新興領域,如個性化健康預測、改善農業和網路安全等,也將需要HPC基礎設施來支援其發展。
目前,HPC市場的需求並未減少,反而隨著AI的興起而擴大。資料中心需要重新設計其IT基礎設施,以支援新的AI工作負載和應用,這將成為未來的重要挑戰。根據估計,當前的伺服器機架在滿載時的功耗約為15-18 kW,而在AI應用中,單個8U節點的功耗可達到10 kW,甚至高達40 kW,這對資料中心的設計提出了巨大挑戰。
因此,資料中心在增加AI基礎設施時,首先需要檢查其電力供應是否足夠,並考慮現有設備的電力消耗。進行系統審核後,許多資料中心可能會發現其電力消耗中有20%的浪費。此外,冷卻能力也是一個重要考量,現代運算設備能在較高的溫度下運行,液冷技術可能成為未來的趨勢。
總之,隨著AI和HPC的需求不斷增長,資料中心必須提高其IT效率,確保工作負載在最佳配置上運行,並持續監測效率指標,以應對不斷變化的市場需求。
(首圖來源:shutterstock)






