本月發表的《Scalable MatMul-free Language Modeling》新論文,研究人員提出 MatMul-free 語言模型(MatMul-Free LM),該模型性能與最先進的 Transformer 相當,同時推論過程需要的記憶體用量更少。
新研究從 LLM 消除 MatMul 操作,模型記憶體用量減十倍 |
| 作者 陳 冠榮|發布日期 2024 年 06 月 14 日 17:40 | 分類 AI 人工智慧 , 記憶體 |



