阿里巴巴推出混合推理模型 Qwen3，無縫切換思考和非思考模式

阿里巴巴集團發表通義千問大型語言模型最新成員 Qwen3，包括 6 款密集模型與 2 款混合專家模型（Mixture of Experts Models，MoE），性能接近 OpenAI、Google 等公司的專有模型。Qwen3 有助於開發者開發適合於行動裝置、智慧眼鏡、自駕車及機器人等場景的 AI 應用。

Qwen3 全系列開源並在全球上線，包含 6 款密集模型（Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B、Qwen3-0.6B）和 2 款混合專家模型（Qwen3-235B-A22B、Qwen3-30B-A3B）。

Qwen3 是阿里巴巴集團首次發表的混合推理模型，可無縫切換「思考模式」與「非思考模式」，前者專攻數學、程式碼編輯及邏輯推理等多步驟複雜任務，後者可為用戶提供快速、通用型的回應。透過 API 使用 Qwen3，開發者能夠精細控制思考時長（最高可達 38K 詞元），在回應表現和運算效率之間取得平衡。

Qwen3 做到更自然、更具互動性的對話，而且它支援 119 種語言甚至是方言，有利於翻譯與多語種指令解讀。由於 Qwen3 原生支援 MCP（Model Context Protocol），具有强大的函式呼叫能力（Function Calling），可處理複雜代理任務。

做為混合專家模型的 Qwen3-235B-A22B 對於 Arena-Hard 在內的基準測試表現優於 DeepSeek-R1 和 OpenAI o1，並且接近最新的 Google Gemini 2.5 Pro 性能。相較其他先進模型，Qwen3-235B-A22B 也大幅降低部署成本，有利於企業和開發者採用。

Introducing Qwen3!

We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC

— Qwen (@Alibaba_Qwen) April 28, 2025