阿里千問推 Qwen3 新編程模型,顯著降低推理成本

作者 | 發布日期 2026 年 02 月 04 日 14:40 | 分類 AI 人工智慧 , 軟體、系統 line share Linkedin share follow us in feedly line share
Loading...
阿里千問推 Qwen3 新編程模型,顯著降低推理成本

綜合中媒報導,阿里巴巴千問 4 日正式推出 Qwen3-Coder-Next,為一款專為編碼代理與本地開發優化的開放權重語言模型。

該模型基於Qwen3-Next-80B-A3B-Base建構,採用混合注意力與MoE新架構,透過大規模可執行任務合成、環境互動及強化學習進行智慧體訓練,在顯著降低推理成本的同時,獲得了強大的程式設計與智慧體能力。該模型已開源至ModelScope與Hugging Face平台。

使用SWE-Agent框架時,Qwen3-Coder-Next在SWE-BenchVerified上達到70%以上準確率。在多語言設置及更具挑戰的SWE-Bench-Pro基準上保持競爭力。儘管啟動參數規模很小,該模型在多項智慧體評測上仍能匹敵或超過若干更大的開源模型。Qwen3-Coder-Next(3B啟動)的SWE-Bench-Pro表現可與啟動參數量高10到20倍的模型相當。

(Source:Qwen

(本文由 MoneyDJ新聞 授權轉載;首圖來源:影片截圖)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》