☰

阿里通義千問重磅升級 Qwen3-235B-Instruct登頂開源大模型

7月21日，阿里雲旗下通義千問團隊宣佈完成旗艦模型Qwen3的重大更新，正式推出全新版本Qwen3-235B-A22B-Instruct-2507-FP8。這一升級標誌着國產大模型在通用能力上實現新的突破，在多項國際權威測評中超越包括Kimi-K2、DeepSeek-V3等在內的頂級開源模型，以及Claude-Opus4-Non-thinking等閉源模型。

就在上週五，國際權威大模型排行榜LMArena剛剛宣佈月之暗面推出的萬億參數開源模型Kimi K2登頂全球開源模型榜首。而此次阿里通義千問的快速跟進升級，展現了國產大模型領域的激烈競爭與快速迭代能力。新版本Qwen3在指令遵循、邏輯推理、文本理解、數學計算、科學素養、編程能力和工具調用等核心維度均實現顯著提升，在GQPA知識測評、AIME25數學競賽、LiveCodeBench編程評測、Arena-Hard人類偏好對齊測試以及BFCL智能體能力評估等關鍵指標上表現優異。

技術升級方面，新版模型重點強化了五大核心能力：首先，在多語言長尾知識覆蓋上取得突破性進展，顯著提升了小語種和專業知識領域的理解能力；其次，在主觀題和開放性任務處理上，模型對用戶偏好的理解更加精準，回覆質量與實用性大幅提升；第三，上下文窗口擴展至256K，大幅增強了長文本理解和複雜任務處理能力；此外，模型在推理效率和資源消耗方面也進行了優化平衡。

值得關注的是，此次升級後的Qwen3-235B-Instruct版本已在魔搭社區和HuggingFace平臺正式開源。這一舉措不僅體現了阿里雲在推動大模型技術普惠方面的承諾，也爲全球開發者提供了更強大的技術工具。分析人士指出，在Kimi K2登頂開源榜首僅一週後，阿里通義千問就推出更具競爭力的升級版本，顯示出中國大模型產業"你追我趕"的創新活力。隨着多模態、Agent等技術的融合發展，國產大模型正在全球競爭中佔據越來越重要的位置。

阿里通義千問重磅升級 Qwen3-235B-Instruct登頂開源大模型

相關資訊