阿里(09988)通義千問推出新模型Qwen3-30B-A3B-Thinking-2507
智通財經APP獲悉,7月31日,阿里(09988)通義千問向大家介紹新模型Qwen3-30B-A3B-Thinking-2507,一個更睿智、更敏捷、更全能的新推理模型。目前,Qwen3-30B-A3B-Thinking-2507已在魔搭社區、HuggingFace上開源。
相較於4月29日開源的Qwen3-30-A3B模型,新模型在推理能力、通用能力及上下文長度上有了顯著提升:
數學超強,代碼賊溜:新模型在聚焦數學能力的AIME25評測中斬獲85.0的高分,在代碼能力測試LiveCodeBench v6中得分66.0,兩項核心推理能力均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知識水平(GPQA、MMLU-Pro)也較上一版本進步顯著。
善解人意,全面升級:在寫作(WritingBench)、Agent能力(BFCL-v3)、多輪對話和多語言指令遵循(MultiIF)等通用能力評測中,Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking)。
更長的上下文理解:原生支持256K tokens,可擴展至1M tokens。
此外,新模型的思考長度(thinking length)也增加了,推薦在高度複雜的推理任務中設置更長的思考預算,以充分發揮它的潛力。