
阿里巴巴集團發表通義千問大型語言模型最新成員 Qwen3,包括 6 款密集模型與 2 款混合專家模型(Mixture of Experts Models,MoE),性能接近 OpenAI、Google 等公司的專有模型。Qwen3 有助於開發者開發適合於行動裝置、智慧眼鏡、自駕車及機器人等場景的 AI 應用。
Qwen3 全系列開源並在全球上線,包含 6 款密集模型(Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B)和 2 款混合專家模型(Qwen3-235B-A22B、Qwen3-30B-A3B)。
Qwen3 是阿里巴巴集團首次發表的混合推理模型,可無縫切換「思考模式」與「非思考模式」,前者專攻數學、程式碼編輯及邏輯推理等多步驟複雜任務,後者可為用戶提供快速、通用型的回應。透過 API 使用 Qwen3,開發者能夠精細控制思考時長(最高可達 38K 詞元),在回應表現和運算效率之間取得平衡。
Qwen3 做到更自然、更具互動性的對話,而且它支援 119 種語言甚至是方言,有利於翻譯與多語種指令解讀。由於 Qwen3 原生支援 MCP(Model Context Protocol),具有强大的函式呼叫能力(Function Calling),可處理複雜代理任務。
做為混合專家模型的 Qwen3-235B-A22B 對於 Arena-Hard 在內的基準測試表現優於 DeepSeek-R1 和 OpenAI o1,並且接近最新的 Google Gemini 2.5 Pro 性能。相較其他先進模型,Qwen3-235B-A22B 也大幅降低部署成本,有利於企業和開發者採用。
Introducing Qwen3!
We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC
— Qwen (@Alibaba_Qwen) April 28, 2025
▲ 阿里巴巴集團發表 Qwen3。
- Alibaba unveils Qwen3, a family of ‘hybrid’ AI reasoning models
- Alibaba launches open source Qwen3 model that surpasses OpenAI o1 and DeepSeek R1
- Alibaba claims leadership in AI reasoning with latest Qwen3 models
(首圖來源:Qwen)