阿里通義千問推出視覺推理新模型 QVQ-Max

綜合中媒報導，阿里巴巴旗下阿里雲通義千問團隊發布新一代視覺推理模型 QVQ-Max。據悉，該模型不僅能夠辨識關鍵元素，還能結合背景知識進行深入推理，提供更具價值的結論。此外， QVQ-Max 的核心能力可總結為三個方面，包括細致觀察、深入推理及靈活應用。

阿里指出，QVQ-Max對圖片的解析能力非常強，無論是複雜的圖表還是日常生活中隨手拍的照片，它都能快速辨識出關鍵元素；同時，QVQ-Max還能進一步分析這些信息，並結合背景知識得出結論；除分析和推理外，QVQ-Max也能完成插畫設計、以及生成短影片腳本。

此外，QVQ-Max在職場、學習和生活場景中均有廣泛應用。無論是協助數據分析、解答學科難題，還是推薦穿搭方案、指導烹飪，都能為用戶提供高效建議。目前，用戶可透過Qwen Chat體驗其功能，只需上傳圖片或影片並提出問題，即可獲得智慧推理結果。阿里巴巴表示，未來將持續優化QVQ-Max的性能，進一步拓展其功能邊界。

（本文由 MoneyDJ新聞授權轉載；首圖來源：Qwen）