Google 一推出 TurboQuant 便造成轟動,市場期待這項技術有望解決記憶體短缺問題,但 SK 海力士卻表示,這項技術反而使情況更嚴重。
Google 於 3 月發布名為 TurboQuant 的新演算法,可大幅壓縮 KV 快取,使 AI 工作負載的記憶體需求最高降低至原本的六分之一。該技術一經推出,市場一度傳出記憶體價格將大幅下滑的消息。
當時不少人將價格下跌與 TurboQuant 直接連結,甚至出現恐慌性拋售 DRAM 與記憶體模組的情況,但事實證明,經過市場熱度後,記憶體價格並未持續下跌,需求反而持續成長。
事實上,自 TurboQuant 推出以來,記憶體市場幾乎未受衝擊,AI 公司對記憶體的整體需求反而持續擴大。近期多家 AI 大廠積極擴展產品與服務,推動「代理 AI 時代」的發展。
SK 海力士財務長 Kim Woo-hyun 認為,AI 產業中持續進行的軟硬體最佳化,反而是推升記憶體需求的重要動能之一。雖然這些提升記憶體效率的技術看似能降低單一裝置的記憶體使用量,但實際上正朝向「在單位記憶體中處理更多上下文(context)」的方向發展。
Kim Woo-hyun 預期,這將改善 AI 服務的經濟效益,進而形成正向循環,擴大整體 AI 市場規模,同時帶動記憶體需求持續成長。
SK 海力士也強調,包括 TurboQuant 在內的軟硬體最佳化技術,最終只會進一步推升記憶體需求,而非降低。隨著 AI 公司不斷提高單位記憶體可處理的資料量,加上 CPU 在代理 AI 時代的重要性提升,記憶體使用量預計將持續加速成長。
目前 CPU 需求已開始帶動價格上漲,類似過去記憶體與 GPU 的走勢;而整體 AI 基礎設施需求仍看不到放緩跡象。
(首圖來源:科技新報)






