高階顯卡也能訓練模型,AI 研究人員提出「GaLore」減少記憶體用量

作者 | 發布日期 2024 年 03 月 11 日 18:26 | 分類 AI 人工智慧 , 會員專區 line share Linkedin share follow us in feedly line share
Loading...
高階顯卡也能訓練模型,AI 研究人員提出「GaLore」減少記憶體用量

隨著大型語言模型的規模越來越大,若對所有模型參數進行訓練,成本勢必非常高昂,研究人員設法減少記憶體使用量,其中新方法 GaLore(Gradient Low-Rank Projection)可讓訓練過程更省記憶體,甚至用家中電腦搭配高階顯示卡就能訓練。

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》