AI 時代的資料中心成吃電巨獸,氮化鎵會是能效救星嗎?

作者 | 發布日期 2023 年 10 月 16 日 7:40 | 分類 AI 人工智慧 , 半導體 , 晶片 line share follow us in feedly line share
AI 時代的資料中心成吃電巨獸,氮化鎵會是能效救星嗎?


數位經濟正經歷一場由兩大趨勢驅動的巨大變革,即時資料分析的龐大需求為其一,另一則是生成式人工智慧 (Generative AI) 的快速發展。一場激烈的生成式 AI 競賽正如火如荼的進行中,科技巨頭如亞馬遜 (Amazon)、谷歌 (Google)、微軟 (Microsoft) 皆大舉投資生成式 AI 的研發創新。根據彭博智庫 (Bloomberg Intelligence) 預測,生成式 AI 市場將以 42% 的年增率成長,從 2022 年 400 億美元市值,於 10 年內擴大至 1.3 兆美元。


在 AI 的蓬勃發展下,資料中心對電力與運算的需求呈正比成長,激增的用電量不僅對營運效率造成壓力,更成為資料中心達成淨零排放目標的阻礙。當前資料中心所採用的電力轉換及分配技術,已難以滿足來自雲計算及機器學習的運算需求,面對更龐大能源的生成式 AI 應用,資料中心運營商正急迫地尋找創新電力解決方案。

氮化鎵 (GaN) 功率半導體應運而生,成為資料中心優化能源效率的關鍵技術之一。接下來的文章將進一步探討生成式AI對資料中心帶來的挑戰、氮化鎵功率器件的優勢,最後分析業界普遍使用的「電源使用效率 (Power Usage Effectiveness, PUE)」指標中所存在的漏洞,這些洞察皆將指向一個結論,氮化鎵功率元件在資料中心電力系統中的應用將加速落地。

生成式 AI 對資料中心的衝擊將加劇

面對資料量爆炸,依傳統工作負載量所規劃的資料中心基礎架構正面臨巨大壓力。全球資料量每兩年便翻漲一倍,處理、儲存這些龐大資料的伺服器,需要大量的能源及水資源來維持運作。根據麥肯錫的預測,在未來五年內,光是位於美國地區的資料中心便將新增 39GW 的用電量,相當於 3200 萬的家庭一年的用電量。

生成式 AI 帶來破壞式創新與商機,但隨之而來的能源需求也是前所未有。一篇研究文章指出,訓練最新一代的生成式 AI 模型,較上一代模型高出十至百倍。生成式 AI 應用主要的能耗來自於兩方面,一是訓練構成生成式 AI 系統核心的大型語言模型 (LLMs) 時需要的能源,另外便是大型語言模型運作時的能耗。

生成式 AI 的用電量高的難以置信,假設每次 Google 搜索需耗費相當於一個 100 瓦燈泡發光 11 秒鐘的電量,如今當紅的生成式 AI 應用工具 ChatGPT 每回答一個問題的用電量,竟比 Google 搜索高出 50-100倍。面對突增的電力需求,升級資料中心架構迫在眉睫,資料中心業者更直言接下來 4 年資料中心在升級設備的花費預估將高達 1 兆美元。

雖然如浸沒式冷卻、人工智慧優化方案、廢熱再利用等新興技術已經出現,但這些方案皆無法從根本解決問題。由於基於矽開發的功率元件效率低落,現今的資料中心高度依賴冷卻系統來維持安全的運作溫度,因此兼具能效、尺寸優勢及輸出功率的電力解決方案正是當前資料中心急迫所需。

氮化鎵具無可匹敵的效率與性能

相較傳統電源供應器,基於氮化鎵功率元件設計的電源供應器,能實現超群的性能與效率,在生成式 AI 應用不斷升級下,成為資料中心理想選擇。憑藉更快的開關速度及卓越的輸入和輸出品質因數 (Figures of Merit),氮化鎵實現電源設計上的優勢,帶來超越鈦金級的能效表現,並大幅提高功率密度。

氮化鎵電晶體為電源設備帶來更高的效率水準,效率提高代表能源損耗減少,設備也能減少過熱情形。舉例來說,在典型資料中心架構中,基於氮化鎵設計的電源供應器每年可為每 10 個機架增加 300 萬美元的營收,減少 100 公噸的二氧化碳排放量,省下 13,000 美元的運營支出。當生成式 AI 對電力需求持續攀升、且每機架的功率密度提升至 2-3 倍時,這些氮化鎵所帶來的優勢將更顯著。

你也許會好奇,氮化鎵的所帶來的好處如此顯而易見,但為什麼資料中心業者沒有立即轉用這項技術?廣受資料中心使用的 PUE 指標中有一項經常被忽視的盲點,也就是我們所稱「能耗指標漏洞 (PUE Loophole)」,這便是氮化鎵技術普及受限的主因。

什麼是能耗指標漏洞

PUE 代表 IT 設備負載耗電量占總耗電的比例,普遍作為評估資料中心能源效率的指標。密切監控並持續改善 PUE 對資料中心運營優化十分重要,降低 PUE 代表減少用電量,進而減少運營成本及環境衝擊。

然而,PUE 僅計算了電力傳輸至伺服器的效率,卻忽略了伺服器中電力轉換間的能源損耗,這便是能耗指標漏洞,資料中心以 PUE 作為評估整體運營成效時會產生的盲點。

這個盲點造成當前許多伺服器仍採用效率僅有 90% 甚至更低的 AC-DC 轉換器,這代表了每次 AC-DC 能源轉換間,有 10% 的能源在轉換中被浪費了,這不但增加了電費成本及碳排放量,被浪費的能源同時以熱的方式排出,進而提升資料中心對額外冷卻系統的需求,冷卻系統也是另一個非常耗電的設備。

氮化鎵功率半導體將為這個挑戰帶來轉機,為資料中心提供一個立即見效且高性價比的方式來解決能耗指標的漏洞,並省下龐大的電力需求。採用氮化鎵功率元件的 AC-DC 轉換器,效率可達到 96% ,甚至更高,所減少的功率耗損達50%,以資料中心平均用電量換算,相當於節省了 370 億千瓦小時的電量,足以供應 40 座超大規模資料中心一年的電力需求。

(作者:Paul Wiener,GaN Systems策略行銷副總;首圖來源:Google)