外媒報導,Google 研究團隊於日前正式發表了一項名為「TurboQuant」的全新免訓練(training-free)壓縮演算法。這項革命性的技術能夠將大型語言模型的鍵值快取(KV caches)大幅壓縮至僅剩 3 位元(3 bits),且過程完全不會造成模型準確度的損失。
衝擊記憶體股下跌原因找到了!Google 開發全新壓縮演算法 TurboQuant |
| 作者 Atkinson|發布日期 2026 年 03 月 26 日 8:00 | 分類 AI 人工智慧 , Google , 軟體、系統 |












