阿里雲開源通義千問 14B 模型,擬共建大模型市場

作者 | 發布日期 2023 年 09 月 26 日 10:30 | 分類 AI 人工智慧 , 中國觀察 line share follow us in feedly line share
阿里雲開源通義千問 14B 模型,擬共建大模型市場


上證報報導,阿里巴巴集團的數位技術和智慧骨幹業務阿里雲 25 日開源通義千問 140 億參數模型 Qwen-14B 及其對話模型 Qwen-14B-Chat,可免費商用。

阿里雲副總裁、公眾與客戶溝通部總經理張啟表示,不管是閉源還是開源大模型,自研還是第三方大模型,大規模或小規模參數模型,以及通用或行業、企業專屬大模型,阿里雲全部歡迎和支援,共同建設一個最大的大模型自由市場;希望所有大模型都能跑在阿里雲上,跑得更快、更便宜、更安全。也因如此,阿里雲率先開源7B、14B模型,並將持續開源開放。

據了解,大規模預訓練模型參數量大、訓練成本高,開源大模型可幫助用戶簡化模型訓練和部署過程,使得使用者不必從頭訓練模型,只需下載預訓練好的模型並進行微調,就可快速建構高品質的模型或進行相應的應用開發。目前,7B(70億)參數是開源大模型中最常見的規模,此外,較常見的開源模型尺寸還有13B(130億)、20B(200億)、70B(700億)等。

在此之前,今年8月阿里雲開源通義千問70億參數基座模型Qwen-7B,一個多月下載量突破100萬。此次最新開源的Qwen-14B是一款支援多種語言的高性能開源模型,相較同類模型使用了更多的高品質數據,整體訓練數據超過3兆Token,使得模型具備更強大的推理、認知、規劃和記憶能力;用戶可從魔搭社區直接下載模型、體驗模型,也可透過阿里雲靈積平台訪問和調用Qwen-14B和Qwen-14B-Chat。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:通義大模型