
綜合中媒報導,阿里巴巴今日凌晨開源了 2 款 Qwen3 系列新模型,Qwen3-Embedding 和 Qwen3-Reranker,專為文本表徵、檢索與排序任務設計,基於 Qwen3 基礎模型進行訓練。
官方表示,在多項基準測試中,Qwen3-Embedding系列在文本表徵和排序任務中展現了卓越的性能。
數據顯示,Qwen3-Embedding系列在多個下遊任務評估中達到行業領先水準。其中,8B參數規模的Embedding模型在MTEB多語言Leaderboard榜單中位列第一,性能超越眾多商業API服務。此外,該系列的排序模型在各類文本檢索場景中表現出色,顯著提升了搜索結果的相關性。同時,Qwen3-Embedding系列提供從0.6B到8B參數規模的3種模型配置,以滿足不同場景下的性能與效率需求。
阿里巴巴指出,模型支持以下定製化特性,包括表徵維度自定義,允許用戶根據實際需求調整表徵維度,有效降低應用成本;以及指令適配優化,支持用戶自定義指令模板,以提升特定任務、語言或場景下的性能表現。
此外,Qwen3-Embedding系列支持超過100種語言,涵蓋主流自然語言及多種編程語言。該系列模型具備強大的多語言、跨語言及代碼檢索能力,能夠有效應對多語言場景下的數據處理需求。