AI 競賽進入系統整合時代,CompuForum 2026 點出記憶體、儲存成新戰場

作者 | 發布日期 2026 年 06 月 18 日 10:00 | 分類 AI 人工智慧 , 伺服器 , 半導體 line share Linkedin share follow us in feedly line share
Loading...
AI 競賽進入系統整合時代,CompuForum 2026 點出記憶體、儲存成新戰場

集邦科技(TrendForce)日前盛大舉辦 CompuForum 2026 論壇,為全球 AI 產業未來的發展趨勢定調。在論壇的開場演說中,集邦科技資深研究副總吳雅婷表示,受惠於北美主要雲端服務供應商(CSP)對於 AI 基礎設施的強勁需求,2026 年全球頂尖 CSP 業者的資本支出指引已經再度獲得上修。據預估,全年的資本支出將攀升至高達 8,300 億美元的驚人規模,其年增率更是由原先市場預估的 61%,大幅跳升至 79%。

然而,吳雅婷特別點出,這筆龐大資金的流向,揭示了市場發展敘事已經發生了迅速且根本性的轉變。企業的投資重心已經跨越了早期單純採購 GPU 以及盲目追求算力擴充的狂熱階段,如今已正式進入了「系統整合的關鍵攻防戰」。她強調,即便擁有世界上最快的運算晶片,倘若受限於記憶體的傳輸瓶頸,或者是資料中心的基礎設施無法有效處理其龐大的散熱與能耗問題,這些頂級晶片將毫無用武之地。

面對真實世界的工程挑戰,吳雅婷表示,本屆論壇將深度聚焦於 AI 基礎設施生態系的三大系統整合核心面向。首先是「記憶體與儲存」,其次是「電力與伺服器管理」,最後則是「市場競爭與 AI 導入」,深入分析硬體平台的競爭態勢,並探討企業界應如何實際導入企業級 AI 代理(AI agents)、從雲端至邊緣平台的管理,以及優化 GPU 治理,藉此實現永續成長的目標。

威剛科技TRUSTA 品牌迎接全球 AI 產業超級循環

首先進行演講的威剛科技(ADATA)產品行銷資深經理謝英博明確指出,未來的 AI 算力強弱,將不再僅僅取決於運算晶片的效能,記憶體的運作效率與儲存系統的擴充性,已正式成為推動次世代 AI 發展的核心基礎設施。

謝英博將 AI 的發展劃分為兩大波段,第一波是以「模型訓練」為主軸,這帶動了雲端服務供應商大量建置基礎設施,並引發對高頻寬記憶體(HBM)的龐大渴求。而目前正在強勢崛起推論與代理人 AI(Agent AI),預估到了 2030 年,全球資料中心的 AI 推論負載需求將飆升至 93.3 GW,正式超越訓練階段的 62.2 GW。相較於訓練階段,推論階段面臨著極高查詢率(QPS)的嚴苛壓力,因此系統必須具備持續且超低延遲的資料存取能力。

在多輪對話與長文本處理需求與日俱增的趨勢下,大型語言模型在進行推論時,必須儲存並重複使用大量的KV 快取,以加速內容生成並提供即時回應。然而,距離運算核心最近的 GPU HBM 雖然速度極快,但受限於價格昂貴且容量有限,根本無法應付不斷膨脹的上下文資料量。為解決此一運算瓶頸,KV 快取已開始從 GPU HBM 向下延伸至系統 DRAM,甚至進一步移動至本地端的高速 SSD。

在這樣的新層級中,扮演「G3.5」角色的 CXL/NVMe 企業級 SSD,便成為了兼顧極致效能與建置成本的最關鍵平衡點。這項技術架構轉變促使 NVMe eSSD 市場需求激增,從 2024 年至 2029 年,企業級 eSSD 的需求預估將呈現 4.5 倍的驚人成長,年複合成長率(CAGR)高達 34.9%。瞄準此市場需求,威剛科技重磅推出專為企業儲存與 AI 基礎設施量身打造的「TRUSTA」品牌,涵蓋多款高規格 eSSD,具備工業級耐用度與斷電保護(PLP)。

針對企業部署 AI 常面臨的痛點,謝英博特別介紹榮獲 BC Award 肯定的「TRUSTA AI Scaler」軟體工具包。該方案能整合 GPU VRAM、系統 DRAM 與 SSD 的高容量資料串流能力,讓中小企業與醫療院所能在不需重金添購大量 GPU 的前提下,順利於本地端部署超大型 AI 模型,不僅確保資料隱私,更大幅提升部署彈性。謝英博總結道,在 AI 大時代的演進中,記憶體與儲存裝置已華麗轉身,與運算力並列為決定 AI 領先地位的三大關鍵。

華邦電強調運算架構複雜使基礎元件技術升級刻不容緩

華邦電子資深工程師劉孝軒在演說中指出,專門用於儲存開機程式與設備韌體的「程式碼儲存快閃記憶體」,正迎接一波極為強勁的成長動能。尤其伺服器大廠對此類記憶體提出了四大核心要求,包括高效能、高可靠度、低電壓以及高安全性。在現今的 AI 伺服器架構中,除了 CPU 之外,包括伺服器管理晶片(BMC)、GPU、FPGA、DPU,乃至於高速交換器(Switch)與電源及散熱系統,皆需要獨立的開機韌體。這導致單一 AI 伺服器機櫃(Rack)內部,可能搭載高達數百顆的程式碼儲存快閃記憶體,且儲存容量需求呈現穩定攀升趨勢。

針對效能與低電壓趨勢,為了讓網卡或交換器等設備快速開機,華邦提供了具備更高時脈速度與 8 個 I/O(Octal NOR)的解決方案,大幅提升資料吞吐量。此外,隨著 SoC 晶片製程技術推進至 7 奈米甚至 5 奈米以下,晶片內部的 I/O 工作電壓已降至 0.5V 至 0.6V 區間。倘若周邊 Flash 依然採用 1.8V 或 3.3V 電壓規格,系統就必須額外增加電壓轉換元件,不僅增加 BOM 成本,在 AI 伺服器高頻高溫環境下,更會帶來訊號完整性的嚴峻挑戰。為此,華邦領先業界推出了 1.2V 超低電壓的 Flash 產品,完美滿足先進處理器的無縫接軌需求。另一方面,AI 伺服器產生的高熱能,使得快閃記憶體的耐溫要求從 85°C 提升至 105°C 甚至高達 125°C 的極端標準。

為確保系統不會因單一位元翻轉而無法開機,華邦除了導入車用等級驗證精神,更全面在產品內部建置「零延遲硬體 ECC(錯誤修正碼)」,即時修正錯誤並延長產品使用壽命。在資安防護方面,未來的防護正走向最底層的「硬體防護」。華邦推出的 Secure Flash 方案符合 NIST SP 800-193 規範,透過 SHA-256 機制防範降級攻擊。針對複雜的代工與組裝生態系,華邦更創新提出了「安全供應鏈」防護架構。從晶片出廠端即預先燒錄私密金鑰,雲端伺服器可透過 PQC 加密演算法進行遠端驗證,確保 Flash 晶片與韌體百分之百為原廠正品且未遭惡意置入,從源頭徹底阻絕供應鏈破口。

希捷科技藉硬碟技術與混合架構提高數位競爭力

希捷科技業務經理程敬智在論壇的演說中指出,人類正處於一個極為關鍵的死亡交叉點,也就是大約在 2025 年,由 AI 生成的資料量將正式超越由人類所產出的內容。為了協助企業應對龐大的資料儲存需求並兼顧永續發展,希捷重磅推出了新一代高容量硬碟與可組合式儲存架構。

程敬智指出,邁入 AI 時代,未來的資料產生量預估將上看數百個 Zettabytes。建構卓越的 AI 不僅需要強大算力,更需要海量資料作為訓練基礎,使資料躍升為數位經濟時代中最重要資產。然而,當前 AI 基礎建設正面臨兩大嚴峻瓶頸,第一是電力與散熱,第二則是資料儲存的產能限制。

統計顯示,目前雲端資料中心有高達 87% 的儲存空間依然仰賴傳統硬碟建構。因此,如何在有限實體空間與電力下儲存更多資料,成為企業亟待克服的課題。為突破空間與能耗限制,希捷科技傾全力提升硬碟的「磁錄密度」與單位容量。程敬智舉例,透過 Seagate Mozaic 4+ 等技術升級,單顆硬碟的總容量可從 30TB 大幅跨越至 44TB 的新境界。

他指出,以建置 1 Exabyte(EB)規模的資料中心為例,若全面採用新一代 44TB 硬碟,可將硬碟總數量從 33,330 顆大幅縮減至 22,700 顆。這不僅為企業節省可觀的機房空間,耗電量更能從 2.6GWh 顯著降低至 1.8GWh,整體營運效率提升高達 47%。此舉大幅優化了單位儲存成本,更直接助力企業減少碳排放,符合嚴格的 ESG 規範。

除了硬碟技術的突破,希捷也同步發表了「新一代可組合式混合架構(Composable Hybrid Architecture)」。其中,新一代 JBOD 系統(如 Seagate Exos 4U74/4U100),這套高密度儲存架構最高可容納多達 100 顆 32TB 硬碟,單一機櫃總容量高達 3.2PB。這項解決方案專為大規模資料生命週期管理所設計,目的在達成「大規模資料存取」、「營運簡化」、「資源效率最佳化」及「未來擴展能力」四大策略影響。面對未來從中心化走向邊緣運算(Edge AI)的必然趨勢,希捷期望透過升級儲存架構,協助企業與消費者保護資料資產,在 AI 浪潮中創造更高的數位競爭力。

集邦科技指 AI 技術演進對伺服器記憶體產生結構性震撼

集邦科技資深分析師許家源指出,新一代 Agentic AI 更加強調任務規劃與執行,使處理器需求轉向高階 x86 CPU,並同步帶動 RDIMM 與 Enterprise SSD 需求的巨幅成長。值得關注的是,AI 伺服器的 RDIMM 需求正出現向 32GB 甚至 16GB 等「小容量」模組靠攏的趨勢。

許家源剖析背後有四大驅動力,首先是運算架構改變,Agentic AI 每個核心僅需 1.5 至 2GB 的 DRAM。其次是為因應先進 CPU 供應吃緊,市場轉向採用搭配小容量 RDIMM 的舊款 CPU。第三是為了最大化頻寬,伺服器設計傾向插滿所有記憶體通道,採用低容量模組成為最佳解方。最後則是成本考量,大容量模組存在價格溢價,改用小容量能大幅降低整體系統成本。

為應對 CPU 算力躍升,記憶體模組的傳輸規格升級勢在必行。許家源點出,已納入 JEDEC 標準的 MRDIMM 滲透率預期將在 2027 年之後進入加速期。MRDIMM Gen 1 傳輸率可達 8,800 MT/s,未來的 Gen 2 將高達 12,800 MT/s;目前以 Google 採用態度最為積極,美光也提供完整產品線,唯獨 MRDIMM 必須搭配 2U 伺服器機箱而犧牲部分設計彈性。此外,LPDDR 正透過 SOCAMM 模組形式打入非 NVIDIA 平台,包含 AMD 與 Qualcomm 皆計畫導入,此設計不僅提升升級彈性,更創造全新封裝商機。

許家源進一步預警,AI 需求正無可避免地吞噬常規記憶體的產能。伺服器 DRAM 與 HBM 需求爆發(2024-2028 複合成長率達 37.4%),預估到 2027 年其佔總 DRAM 供給比例將突破 60%,PC 與智慧型手機 DRAM 產能將遭嚴重排擠。他點出一個反直覺現象:受良率與競爭影響,目前高容量 DDR5 RDIMM 的晶圓平均銷售單價實際上高於 HBM3e。為彌補利潤並支撐 HBM 開發成本,集邦科技預判大客戶與原廠議定的 2026 年 HBM 合約價將面臨大幅上漲,甚至有「漲一倍」的可能。他強烈建議採購端客戶,應把握當前時點提前啟動 2027 年的供應合約談判,以鞏固未來產能收斂時的供貨安全。

(首圖來源:shtterstock;圖片來源:集邦科技)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》