阿里通義千問推出視覺推理新模型 QVQ-Max

作者 | 發布日期 2025 年 03 月 28 日 15:25 | 分類 AI 人工智慧 , 軟體、系統 line share Linkedin share follow us in feedly line share
Loading...
阿里通義千問推出視覺推理新模型 QVQ-Max

綜合中媒報導,阿里巴巴旗下阿里雲通義千問團隊發布新一代視覺推理模型 QVQ-Max。據悉,該模型不僅能夠辨識關鍵元素,還能結合背景知識進行深入推理,提供更具價值的結論。此外, QVQ-Max 的核心能力可總結為三個方面,包括細致觀察、深入推理及靈活應用。

阿里指出,QVQ-Max對圖片的解析能力非常強,無論是複雜的圖表還是日常生活中隨手拍的照片,它都能快速辨識出關鍵元素;同時,QVQ-Max還能進一步分析這些信息,並結合背景知識得出結論;除分析和推理外,QVQ-Max也能完成插畫設計、以及生成短影片腳本。

此外,QVQ-Max在職場、學習和生活場景中均有廣泛應用。無論是協助數據分析、解答學科難題,還是推薦穿搭方案、指導烹飪,都能為用戶提供高效建議。目前,用戶可透過Qwen Chat體驗其功能,只需上傳圖片或影片並提出問題,即可獲得智慧推理結果。阿里巴巴表示,未來將持續優化QVQ-Max的性能,進一步拓展其功能邊界。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:Qwen

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》