Tag Archives: 通義千問

阿里巴巴推出混合推理模型 Qwen3,無縫切換思考和非思考模式

作者 |發布日期 2025 年 04 月 29 日 16:29 | 分類 AI 人工智慧

阿里巴巴集團發表通義千問大型語言模型最新成員 Qwen3,包括 6 款密集模型與 2 款混合專家模型(Mixture of Experts Models,MoE),性能接近 OpenAI、Google 等公司的專有模型。Qwen3 有助於開發者開發適合於行動裝置、智慧眼鏡、自駕車及機器人等場景的 AI 應用。

繼續閱讀..

阿里通義千問推出視覺推理新模型 QVQ-Max

作者 |發布日期 2025 年 03 月 28 日 15:25 | 分類 AI 人工智慧 , 軟體、系統

綜合中媒報導,阿里巴巴旗下阿里雲通義千問團隊發布新一代視覺推理模型 QVQ-Max。據悉,該模型不僅能夠辨識關鍵元素,還能結合背景知識進行深入推理,提供更具價值的結論。此外, QVQ-Max 的核心能力可總結為三個方面,包括細致觀察、深入推理及靈活應用。 繼續閱讀..

阿里最新多模態模型開源 主打視覺語言

作者 |發布日期 2025 年 03 月 25 日 15:45 | 分類 AI 人工智慧 , 軟體、系統

綜合中媒報導,在 DeepSeek-V3 更新的同一夜,阿里巴巴旗下阿里雲通義千問 Qwen 發表 Qwen2.5-VL-32B-Instruct,先前開源家族視覺語言模型 Qwen2.5-VL 包括 3B、7B 和 72B 三種尺寸,這次的 32B 版本進一步兼顧尺寸和性能,可在本地運行,並經過強化學習優化,在三個方面改進顯著,包括回答更符合人類偏好、擁有更強的數學推理能力,以及在圖像解析、內容辨識、視覺邏輯推導等任務中,表現出更強的準確性和細粒度分析能力。 繼續閱讀..

阿里巴巴發布推理模型 QwQ,擅長數學理解/編程

作者 |發布日期 2025 年 02 月 25 日 15:45 | 分類 AI 人工智慧 , 軟體、系統

港媒及中媒報導,阿里巴巴旗下通義千問團隊發表新推理模型「深度思考」(QwQ),由 QwQ-Max-Preview 所驅動,基於 Qwen2.5-Max 開發,專注於數學理解、編程(程式編碼)及 AI 智慧體等領域,除具備強大的推理能力,還支持聯網搜尋功能,可進一步提升實用性。 繼續閱讀..

美國強化半導體禁令,DeepSeek 或引來更嚴格管制措施

作者 |發布日期 2025 年 02 月 08 日 7:30 | 分類 AI 人工智慧 , 半導體 , 國際貿易

美國政府於 2025 年 1 月 13 日提出「人工智慧擴散臨時最終規範」之後,荷蘭政府接著在 1 月 15 日要求 ASML 等半導體製造設備商必須向政府取得許可才能出口特定晶片製造設備;1 月 16 日美國再將 25 家中國企業列入實體清單,涵蓋半導體製造設備零組件供應商、LLM 開發商、AI 晶片開發商。在 Trump 上台前夕,美國政府加速強化半導體禁令,而面對 DeepSeek 的崛起,新政府或提出更嚴格的管制措施。

繼續閱讀..

AI 大模型榜單 阿里雲 Qwen2.5-Max 兩分項領域居首

作者 |發布日期 2025 年 02 月 06 日 10:45 | 分類 AI 人工智慧 , 中國觀察

綜合中媒報導,在最新全球大模型榜單中,阿里巴巴集團數位技術與智慧骨幹業務阿里雲 5 日宣布,其於 1 月發布的全新通義千問 Qwen 2.5-Max 模型在 Chatbot Arena 大模型盲測中排名第七,並在多個基準測試中超越 DeepSeek V3 等競爭對手,包括在技術領域表現尤為出色,於數學和程式設計方面排名第一,在處理複雜任務的固定提示(hard prompts)方面排名第二。 繼續閱讀..

阿里雲推最新 AI 模型/工具及基礎設施,助攻 AI 社群發展

作者 |發布日期 2025 年 01 月 22 日 11:20 | 分類 AI 人工智慧 , 軟體、系統

阿里巴巴集團數位技術與智慧骨幹業務阿里雲 21 日在年度開發者峰會,宣布推出最新大型語言模型及 AI 開發工具,升級基礎設施產品,以及啟動新的全球開發者支持計劃。這些新舉措意在讓全球開發者能夠以更具成本效益的方式建構創新人工智慧(AI)應用,進而推動全球生成式 AI(GenAI)社群的蓬勃發展。 繼續閱讀..