阿里通義千問重磅升級 Qwen3-235B-Instruct登頂開源大模型
7月21日,阿里雲旗下通義千問團隊宣佈完成旗艦模型Qwen3的重大更新,正式推出全新版本Qwen3-235B-A22B-Instruct-2507-FP8。這一升級標誌着國產大模型在通用能力上實現新的突破,在多項國際權威測評中超越包括Kimi-K2、DeepSeek-V3等在內的頂級開源模型,以及Claude-Opus4-Non-thinking等閉源模型。
就在上週五,國際權威大模型排行榜LMArena剛剛宣佈月之暗面推出的萬億參數開源模型Kimi K2登頂全球開源模型榜首。而此次阿里通義千問的快速跟進升級,展現了國產大模型領域的激烈競爭與快速迭代能力。新版本Qwen3在指令遵循、邏輯推理、文本理解、數學計算、科學素養、編程能力和工具調用等核心維度均實現顯著提升,在GQPA知識測評、AIME25數學競賽、LiveCodeBench編程評測、Arena-Hard人類偏好對齊測試以及BFCL智能體能力評估等關鍵指標上表現優異。
技術升級方面,新版模型重點強化了五大核心能力:首先,在多語言長尾知識覆蓋上取得突破性進展,顯著提升了小語種和專業知識領域的理解能力;其次,在主觀題和開放性任務處理上,模型對用戶偏好的理解更加精準,回覆質量與實用性大幅提升;第三,上下文窗口擴展至256K,大幅增強了長文本理解和複雜任務處理能力;此外,模型在推理效率和資源消耗方面也進行了優化平衡。
值得關注的是,此次升級後的Qwen3-235B-Instruct版本已在魔搭社區和HuggingFace平臺正式開源。這一舉措不僅體現了阿里雲在推動大模型技術普惠方面的承諾,也爲全球開發者提供了更強大的技術工具。分析人士指出,在Kimi K2登頂開源榜首僅一週後,阿里通義千問就推出更具競爭力的升級版本,顯示出中國大模型產業"你追我趕"的創新活力。隨着多模態、Agent等技術的融合發展,國產大模型正在全球競爭中佔據越來越重要的位置。