阿里巴巴千問3開源 嗆聲DS-R1

阿里通義千問模型Qwen3 小檔案

大陸科企巨頭阿里巴巴29日凌晨宣佈開源新一代通義千問模型Qwen3(下稱千問3),不僅是大陸首個混合推理模型系列,更高調對標今年爆紅的大陸AI巨頭DeepSeek-R1,參數量僅爲其三分之一,成本大幅下降。此舉更引來美國富豪馬斯克(Elon Musk)較勁,隨後預告發布Grok 3.5早期測試版。

澎湃新聞29日報導,阿里最新推出的千問3性能主打全面超越DeepSeek-R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型,共有8種規格,包含2款參數規模分別爲30B和235B的混合專家(MoE)模型,以及大小從0.6B到32B的6款密集模型。

相比千問2.5,千問3預訓練資料量達36T,且部署成本大幅下降,僅需4張輝達(NVIDIA)H20晶片即可部署千問3滿血版,顯示記憶體佔用僅爲性能相近模型的三分之一。

性能方面,千問3對標市場大模型巨頭,在考察代碼能力的LiveCodeBench評測中,千問3的表現超過Grok3;在評估模型人類偏好對齊的ArenaHard測評中,千問3的分數超越OpenAI-o1和DeepSeek-R1。

千問3依舊採用寬鬆的Apache2.0協定開源,首次支援119多種語言。一經發布,市場反應熱烈,兩小時就在GitHub上獲得1.7萬顆星,空降全球開源模型排行榜冠軍。

另一方面,馬斯克隨即於社羣平臺X發文預告,旗下AI新創公司xAI將在下週發佈Grok 3.5的早期測試版,但僅針對SuperGrok訂閱者發佈。Grok 3.5將是第一個能夠準確回答有關火箭引擎或電化學技術問題的AI模型,強調是從第一原理推理並得出互聯網上根本不存在的答案。