阿里(09988)開源新版Qwen3模型 霸榜文本表徵

智通財經APP獲悉,今日凌晨,阿里巴巴(09988)開源了兩款Qwen3系列新模型,Qwen3-Embedding和Qwen3-Reranker。這兩個模型是專爲文本表徵、檢索與排序任務設計,基於Qwen3基礎模型訓練,充分繼承了Qwen3在多語言文本理解方面的優勢,支持119種語言。根據測試數據顯示,在多語言文本表徵基準測試中,Qwen3 Embedding的性能非常出色。其中,8B參數以70.58的高分排名第一,超越了衆多商業API服務,例如,谷歌的Gemini-Embedding。

卓越的泛化性:Qwen3-Embedding系列在多個下游任務評估中達到行業領先水平。其中,8B參數規模的Embedding模型在MTEB多語言Leaderboard榜單中位列第一(截至2025年6月6日,得分70.58),性能超越衆多商業API服務。此外,該系列的排序模型在各類文本檢索場景中表現出色,顯著提升了搜索結果的相關性。

靈活的模型架構:Qwen3-Embedding系列提供從0.6B到8B參數規模的3種模型配置,以滿足不同場景下的性能與效率需求。開發者可以靈活組合表徵與排序模塊,實現功能擴展。

此外,模型支持以下定製化特性:

1) 表徵維度自定義:允許用戶根據實際需求調整表徵維度,有效降低應用成本;

2) 指令適配優化:支持用戶自定義指令模板,以提升特定任務、語言或場景下的性能表現。

全面的多語言支持:Qwen3-Embedding系列支持超過100種語言,涵蓋主流自然語言及多種編程語言。該系列模型具備強大的多語言、跨語言及代碼檢索能力,能夠有效應對多語言場景下的數據處理需求。

在多項基準測試中,Qwen3-Embedding系列在文本表徵和排序任務中展現了卓越的性能。

目前,該系列模型已在Hugging Face、ModelScope和GitHub平臺開源,用戶也可以直接使用阿里雲百鍊平臺提供的最新的文本向量模型服務。