Tag Archives: KV Cache

跨越 AI 記憶體牆：儲存階層的重新分配與 HBF 剖析

作者 TrendForce 集邦科技|發布日期 2026 年 05 月 05 日 7:00 |

分類 AI 人工智慧 , 半導體 , 封裝測試

混合專家（MoE）架構雖能降低運算需求，但由於所有專家權重必須常駐顯存，Transformer 逐字生成特性也對記憶體頻寬提出高要求；同時，長文本應用 KV Cache 隨對話長度線性增長，龐大模型權重與動態增長的 KV Cache 分別皆對記憶體需求大幅增加，AI 運算瓶頸已從算力不足，轉向記憶體容量受限。繼續閱讀..

突破 HBM 容量問題！華為 UMC 技術、NVIDIA 投資新創從「KV 快取」找新解

作者林妤柔|發布日期 2025 年 08 月 15 日 8:30 |

分類 AI 人工智慧 , 半導體 , 記憶體

生成式 AI 背後的數學運算極為複雜，而且在記憶體頻寬與容量方面存在嚴重瓶頸，因此許多公司不斷祭出解決方案，期盼能解決 HBM 記憶體容量不足問題。繼續閱讀..