
綜合中媒報導,阿里巴巴旗下阿里雲通義千問團隊發布新一代視覺推理模型 QVQ-Max。據悉,該模型不僅能夠辨識關鍵元素,還能結合背景知識進行深入推理,提供更具價值的結論。此外, QVQ-Max 的核心能力可總結為三個方面,包括細致觀察、深入推理及靈活應用。
阿里指出,QVQ-Max對圖片的解析能力非常強,無論是複雜的圖表還是日常生活中隨手拍的照片,它都能快速辨識出關鍵元素;同時,QVQ-Max還能進一步分析這些信息,並結合背景知識得出結論;除分析和推理外,QVQ-Max也能完成插畫設計、以及生成短影片腳本。
此外,QVQ-Max在職場、學習和生活場景中均有廣泛應用。無論是協助數據分析、解答學科難題,還是推薦穿搭方案、指導烹飪,都能為用戶提供高效建議。目前,用戶可透過Qwen Chat體驗其功能,只需上傳圖片或影片並提出問題,即可獲得智慧推理結果。阿里巴巴表示,未來將持續優化QVQ-Max的性能,進一步拓展其功能邊界。