阿里Qwen3-Coder編程大模型闖入全球“第一陣營”,成海外開發者首選
來源:經濟觀察網
23日凌晨,全球大模型領域再次迎來全新的“中國貢獻”。
阿里開源全新的通義千問AI編程大模型Qwen3-Coder,編程能力登頂全球開源模型陣營,並超越GPT4.1等閉源模型,比肩全球最強的編程模型Claude4。
具體來看,Qwen3-Coder在開源模型範圍,全面超越了Kimi-K2和DeepSeek-V3,而與世界領先的大模型相比,在瀏覽器調用(WebArena)、工具調用(BFCL)等Agent能力評測中,Qwen3-Coder刷新開源模型紀錄,超越GPT4.1;在考察模型自主規劃解決編程任務的SWE-Bench評測中,Qwen3-Coder取得了開源最佳效果,可媲美Claude4。
據悉,Qwen3-Coder是千問系列模型中首個採用混合專家MoE架構的代碼模型,總參數達480B,激活35B參數,原生支持256K token的上下文並可擴展至1M長度。
股票市場對上述消息已有反應,展現出投資者對阿里AI最新進展的高度信心。阿里巴巴集團股價在港股午後走高,當天收盤上漲超2.4%。
Qwen3-Coder已在海外收穫大量關注。開源社區HuggingFace CEO克萊門特·德朗格點贊 Qwen3-Coder 新模型,並直言480B編碼模型以及一個可供開發者試用的空間,這真有趣!
風險投資公司a16z(Andreessen Horowitz)負責AI等領域的合夥人馬克·馬斯克羅稱,Qwen3-Coder來了,幾乎與Claude4同樣厲害,在6個榜單的表現甚至還超越了後者,看起來是個很棒的操作系統編程模型。
一衆開發者也在海外社交平臺點評Qwen3-Coder,Amazing(太神了)、Impressive work(令人印象深刻的成果)等成爲關鍵詞。
更爲關鍵的是,Qwen3-Coder在代碼佔比70%的7.5T數據上預訓練,在後訓練階段進行了編程任務及智能體任務的強化學習,最終實現了通用能力、代碼能力及Agent能力的飛昇。
應看到,Qwen3-Coder也極大降低了普通人入門編程的門檻,讓AI氛圍編程(Vibe Coding)真正成爲現實,不懂代碼的小白都可以自己編程一款小遊戲,一句大白話就能把複雜的編程功能變爲己用。
更爲重要的是,AI將會幫助程序員做更多創造性的東西。Qwen3-Coder將成爲程序員的完美助手,比如寫代碼、補全代碼、修Bug等,編程工作效率大幅提升,代碼測試、查詢生成等工作從人工編寫的數小時驟降至數分鐘,多種智能體應用將變得更智能、更高效。
真正的生產力革命也或將因爲編程大模型的落地而加快,從聊天問答到生成圖片視頻,現在AI Coding將實實在在提升工作效率。
以阿里云爲例,2024年4月,其在公司內部全面推行 AI 編程,使用通義靈碼輔助程序員寫代碼、讀代碼、查 BUG、優化代碼等,通義靈碼還獲得了正式的員工工號——AI001。阿里雲相關人士此前透露:“公司未來20% 的代碼將由通義靈碼編寫,但程序員仍然是研發的核心,他們將有更多時間專注於系統設計以及核心業務開發工作。”
當年的雲棲大會上,阿里巴巴集團CEO、阿里雲智能集團董事長兼CEO吳泳銘就已經給出判斷,大模型過去還只能幫助程序員寫簡單的代碼,現在已經能直接理解需求,完成複雜的編程任務。
記者瞭解到,Qwen3-Coder即將接入阿里雲AI編程產品通義靈碼。目前,通義靈碼插件下載量超1700萬,累計生成超30億行代碼,是國內最受歡迎的輔助編程工具。目前,阿里雲內部程序員全員在使用通義靈碼,一汽集團、蔚來汽車、中華財險等超1萬家企業已接入通義靈碼。
從性能而言,開源的Qwen3-Coder性能超過GPT4.1和谷歌,可以跟美國最好的編程模型Cluade 4“掰手腕”,從成本來看,Qwen3-Coder可免費下載商用,且其API遠比Claude4便宜。
最新AI編程大模型Qwen3-Coder API已在阿里雲百鍊上線,每百萬Tokens最低輸入和輸出價格分別爲4元和16元,平均價格爲Claude 4的1/3。
業界認爲,Qwen3-Coder可以說是目前全球最好的編程模型,且有望成爲全球開發者的第一選擇。