阿里,開大了

阿里的開源,再次開大!

文 | 華商韜略 林嵐

8月2日,全球最權威大模型榜單之一的Chatbot Arena發佈了最新排名。

在總榜上,阿里於7月22日上線的全新語言大模型——Qwen3-235B-A22B-Instruct-2507,以1433分名列世界第三。

▲來源:通義千問Qwen

這一分數刷新了全球開源大模型在該榜單的歷史最高分,也是中國大模型的歷史最高分。

同時,Qwen3-235B-A22B-Instruct-2507還在數學、代碼、複雜提示、長文本檢索、指令遵循等5項關鍵能力上奪冠。

此外,由阿里幾乎同一時間開源的AI編程大模型Qwen3-Coder-480B-A35B-Instruct,也在編程能力子榜單中與Gemini2.5 Pro、DeepSeek-R1、Claude4並列全球第一。

【01 開源,更互聯網的大模型】

阿里的以上模型有多強悍呢?

以Qwen3-235B-A22B-Instruct-2507爲例,它能在批量分析電商商品評論的實際應用中,做到精準識別與計算處理,將原本需要2小時的人工打標任務壓縮到了5分鐘,且“數據質量完全可用”。

AI編程大模型Qwen3-Coder-480B-A35B-Instruct,則被認爲“善解人意”程度超過了Gemini2.5 Pro、DeepSeek-R1、Claude4,甚至強悍到僅用三句“大白話”(自然語言)指令,就能構建出一個倉儲物流管理系統。

而以上模型都採用了寬鬆的Apache 2.0許可證進行開源——允許任何人查看、使用其模型的源代碼,並免費商用於各類場景。

▲Qwen3-235B-A22B-Thinking-2507開源頁面截圖來源:智東西

開源,是阿里在通義千問Qwen大模型於2023年面世之前,就定下的基本原則。

當時的大模型,還完全是閉源的天下——知名大模型如Google DeepMind的Gemini、Anthropic的Claude,包括國內百度的文心一言也都是閉源。

即便是以開源爲初衷的OpenAI旗下的GPT,也轉投了閉源的懷抱。因爲,閉源就可以要求用戶成爲付費會員,商業化路徑清晰可見。

而當時標榜開源的Llama(由Meta出品),公開的部分也僅限於模型本身,並未公開訓練代碼和訓練數據等信息,且要求只可用於科研,不可用於商業,被業界戲稱爲“假開源”。

但阿里依然堅定地選擇了開源,因爲開放、開源早已是阿里在技術創新發展上的核心精神和基因。

“吳媽,我們做了很多事情,做的東西也不錯,有技術深度,也有技術挑戰。要不開源吧?讓外部更瞭解我們。”

2010年,時任淘寶網資深技術總監的章文嵩,對時任阿里集團資深副總裁的吳泳銘說道。前者是出了名的開源佈道者,他讀博士時創建的LVS(Linux Virtual Server,Linux虛擬服務器)開源軟件,就已在業界享有盛名。

而吳泳銘的回答則很乾脆:“那你就開始幹。”

章文嵩於是從具體項目着手,開啓了阿里的開源歷程。而後,阿里的開源動作越來越體系化——建立了開源委員會,有了開源流程,且將開源成就作爲每年職級評審的加分項之一。

從此,開源作爲傳統,融入了阿里的血脈。

即使2015年有人提出競爭對手使用阿里開源的軟件實現了研發提速,即使發起人章文嵩後來從阿里離職,這一傳統也未改變。

這也算是馬雲俠客情懷的具體表現之一,是本該有的互聯網精神核心的一部分——我爲人人、人人爲我。

時間來到大模型時代,互聯網越來越成爲水電一樣的基礎設施,卻越來越難再聽到“互聯網精神”的提法,阿里則再次舉起了這面旗幟。

阿里雲CTO周靖人曾在訪談中提到,阿里的願景是“讓天下沒有難做的生意”,阿里雲的初心是“讓企業能在雲上高效實現技術和業務創新”,而開源大模型則是“希望企業能更容易地把大模型用到業務裡”,這三個願景“高度一致、一脈相承”。

現任阿里巴巴集團CEO的吳泳銘也在2024年世界互聯網大會上強調,阿里巴巴將堅持向全球開源開放,把AI能力轉化爲千行百業的生產力。

真正的開放、免費,爲Qwen的後來居上打下一定基礎。但在大模型領域起步較晚的阿里,能在強敵環伺中做到全球領先,另一重要秘訣是從阿里雲就沿襲下來的勤快——又勤又快,飛速迭代。

甚至有人說,阿里通義千問大模型的迭代,快到讓同樣標榜開源的Llama應接不暇——比如在Qwen3首個模型發佈後不到三個月的時間內,Qwen系列又增加了好幾個新模型,刷新了好幾回SOTA。

2023年8月,Qwen系列首個開源模型Qwen-7B悄然發佈。2024年6月,Qwen2-72B在十幾項國際權威測評中勝過曾是開源界最強的Llama系列。如今,Qwen3一再刷新所有國產模型及全球開源模型的性能新高。

短短兩年,開源的Qwen已然走過了萬水千山。

【02 免費,是更大的生意】

Qwen的開源,免費,當然不只是爲了精神,也同樣爲了商業。

其模式,基本等同於互聯網的先“引流”後“變現”——通過開源,吸引更多用戶使用Qwen系列大模型;用戶使用過程中,尤其企業用戶,往往需要採購配套的雲產品,如數據庫、存儲、網絡、安全等——而這些正是身爲亞太最大雲廠商阿里雲的核心業務與長項。

通過開源大模型拉動用戶,再通過用戶推動阿里雲業務。目前,阿里的這一策略已經奏效了。

如今,阿里已開源了數百個大模型。而海內外開源社區中的Qwen衍生模型已超14萬,下載量突破4億。這讓Qwen超越美國Meta公司的Llama,成爲全球使用量第一的開源模型家族。

來自各行業的與日俱增的用戶,不但可爲阿里雲帶來業務增長契機,也能通過應用實踐反哺大模型的優化,進而吸引更多用戶使用。阿里的“模型—雲—行業應用”飛輪因此快速轉起來。

這在阿里的財報中也已得到驗證——2025財年第四季度,阿里雲收入301.27億元,同比增長18%,爲三年來最快增速。其中,AI相關產品的同比增長連續7個季度保持三位數。

伴隨業務發展,阿里大模型對雲業務的帶動效果還會持續加強。

如阿里近期發力的以Qwen3-Coder爲代表的編程大模型,本身就是“油水衙門”——代碼的生成和優化都會消耗大量計算資源,進而拉動雲業務。

這在智能體爆發、對AI編程需求劇增的當前更爲顯著。

比如Anthropic旗下的AI編程模型Claude Code,剛於今年5月開放使用,目前年化收入已超2億美元,賺得盆滿鉢滿。而Qwen3-Coder的性能、使用體驗不次於它,性價比還更高。

有業內人士因此指出,Qwen3-Coder將有力爭奪Claude 4的全球市場份額。而阿里在編程大模型領域的目標,大概也瞄準了在Agent時代來臨之際,通過開源搶佔商業價值和生態勢能的高地。

【03 是開放,也是突破和引領】

目前,中國在全球最具影響力的大模型,可以說就是兩個:Deepseek和Qwen。此次Chatbot Arena總榜上,二者雙雙位居前五。

Deepseek與Qwen的發展路線不同。前者更專注於中英文文本推理,後者更關注多尺寸、多語種、多模態以及Agent適配。但它們都有一個共同的特徵:

開源。

DeepSeek創始人樑文峰曾在24年的訪談中表示:“中國的AI不能永遠做跟隨者……如果不改變這一點,中國永遠只能追趕別人,而不是引領方向。”

阿里巴巴集團董事會主席蔡崇信在23年的雲棲大會上提到:“我們堅信,不開放就沒有生態,沒有生態就沒有未來……我們要始終攀登技術高峰,只有站在更先進、更穩定的技術能力之上,纔有更大的開放底氣。”

目前來看,開源,也是支持這些目標實現的優選途徑。

當下,我國的大模型依然與美國存在一定差距,並且受到美國打壓、制裁等威脅。

比如,大模型領域廣泛使用的底層技術,如Transformer架構、Stable Diffusion模型等均由歐美率先提出並主導,而中國科技創新往往一露頭就被美國各種圍追堵截和封殺。

如2025年1月15日,美國商務部工業和安全局將中國大模型“六小虎”之一的智譜AI及其相關公司列入實體清單,限制其獲取美國技術。

2025年以來,美國和部分歐洲國家也以DeepSeek的數據安全政策爲藉口,展開審查,並在域內對其進行了不同程度的使用限制。

開源讓模型開放,並任使用者審視、修改,且支持在私有等各種環境中運行,大大降低對模型“來自哪個國家”的敏感度,無疑有利於幫助中國大模型突破封鎖,獲得更大的發展空間。

而諸如阿里通義千問,還很早就爲模型在中英文之外,注入多種語言數據,訓練多語言基礎模型,進而使其更加全球化,以全球化超越地緣化。

另外很重要的,開源天然地具有社區性質,本質上是邀約全球開發者一起創新發展,進而也能更好獲得用戶反饋,讓用戶幫助大模型更好迭代發展。

總結就是,開源一方面可以開放突破地緣壁壘,另一方面可以開放與全球開發者一起進化,集中智慧和力量辦大事。對中國的大模型公司而言,它即便不是一條坦途,也更有可能通向勝利。

更長遠看,科技與商業的競爭和發展,從來都不只是單純的技術比拼,也更是格局和眼光的較量。

真正的引領,也不是獨佔鰲頭,而是能同更多人一起往前走,阿里的大模型就正在這樣的路上。

歡迎關注【華商韜略】,識風雲人物,讀韜略傳奇。

版權所有,禁止私自轉載

部分圖片來源於網絡

如涉及侵權,請聯繫刪除