大模型如何發展這條路,任正非李彥宏都想“開”了
2025上半年的最後一天,百度和華爲都想“開”了。今日兩家公司各自宣佈了最新的開源動作。
其中,百度一口氣開源了文心大模型4.5系列的10款模型,涵蓋47B、3B激活參數的混合專家(MoE)模型與0.3B參數的稠密型模型等,並稱實現預訓練權重和推理代碼的完全開源;華爲則宣佈開源盤古70億參數的稠密模型、盤古Pro MoE 720億參數的混合專家模型和基於昇騰的模型推理技術。
在百度、華爲之前,阿里早已通過一系列有競爭力的開源大模型、魔搭社區佈局AI開源生態,騰訊混元此前也開源了混合推理MoE模型 Hunyuan-A13B以及3D生成模型等。
“開源的趨勢早就已經擺在這兒了。”一位AI應用從業者對第一財經記者分析說,去年此時業界討論開源閉源路線之爭時,業界都還在發力底層大模型,究竟哪種模式更好還沒得到真正、充分的驗證。但很快DeepSeek、阿里已經用事實說明了,開源成爲推動AI技術進步和產業發展的重要力量。
這場集體開源行動背後,既是對AI進入應用爲王時代的迴應,也暗含了各家加速搶佔市場高地、應對國際競爭的戰略佈局。
百度、華爲爲什麼變了?
開源的動作折射出巨頭們戰略考量的轉變和市場焦慮。
在過去很長一段時間裡,李彥宏都是閉源大模型的堅定擁護者,去年夏天的一場對話中,他直言“開源其實是一種智商稅。”他給出的理由是,開源大模型學術研究、教學領域等特定場景下有存在的價值,但並不適用於大多數應用場景。“當你處在激烈競爭的環境中,需要讓業務效率比同行更高、成本比同行更低,這時,商業化的閉源模型是最能打的。”
半年後,當“黑馬”DeepSeek以低成本高效率的開源模型突襲並引發全球關注,搜索已經成爲AI工具、AI助手標配的背景下,百度變了。今年2月,百度宣佈從4月1日起文心一言全部免費,上線深度搜索功能,緊接着又宣佈在未來幾個月中陸續推出文心大模型4.5系列,並將在6月30日開源。
同樣,在華爲內部,對於開源也經歷了許久的權衡與糾結。例如,從業務層面,基於昇騰下的軍團以及政企業務線板塊的算力買賣或面臨着一定的壓力。但最終,華爲站在了開源大軍的隊伍裡。
“盤古72B是兼顧性能與推理成本的黃金尺寸,最適合行業用戶用AI改造業務。”華爲內部的一位技術專家曾在5月對記者表示,華爲以前很少對外發聲,盤古也沒有開源,所以大家對昇騰算力具體的情況不是特別瞭解,對模型的情況也不瞭解,外界就充滿了猜疑,甚至認爲昇騰訓練不出來先進的大模型,但實際上目前的昇騰算力已經具備了訓練出世界一流大模型的能力。
從兩家公司披露的開源模型情況看,其中文心大模型4.5開源系列針對MoE架構提出了一種創新性的多模態異構模型結構,適用於從大語言模型向多模態模型的持續預訓練範式,在保持甚至提升文本任務性能的基礎上,顯著增強了多模態理解能力,其優越的性能主要得益於多模態混合專家模型預訓練、訓練推理框架和針對模態的後訓練等關鍵技術點。
百度援引數據顯示,文心多模態後訓練模型(支持思考、關閉思考)在多個多模態基準測試中達到SOTA水平。其中在視覺常識、多模態推理、視覺感知等主流的多模態大模型評測中優於閉源的OpenAI o1。在輕量模型上,文心4.5-21B-A3B-Base文本模型效果與同量級的Qwen3相當。
華爲此次開源則選擇了兩款用量相對較多的模型。其中70億參數的稠密模型部署門檻較低,在智能客服、知識庫等多種場景中均可應用,而盤古Pro MoE 720億參數的混合專家模型更適合處理相對複雜的任務。
華爲此前披露,盤古Pro MoE大模型,在參數量僅爲720億,激活160億參數量的情況下,通過動態激活專家網絡的創新設計可以實現“以小打大”的性能,甚至可以達到千億級模型的性能表現。
“只有越來越開放,才能讓大模型及應用走出實驗室。”上述華爲技術專家表示。
而競爭對手的速度並不慢。從2023年至今,阿里通義團隊已開源200多款模型,對開源模型競賽始終保持着高度投入。例如今年春節DeepSeek爆火期間,阿里雲就曾連續三個凌晨開源三款大模型,一位接近阿里雲的人士告訴記者,目前阿里雲的大模型已基本全部開源,所有開源模型均免費使用。
記者從阿里雲瞭解到,目前,通義千問Qwen衍生模型數量已突破13萬,超越美國Llama模型。通義千問Qwen在全球下載量超過3億,在HuggingFace社區2024年全球模型下載量中千問Qwen佔比超30%。
加速千行百業AI應用
對於百度、華爲等的開源舉動,今日阿里雲CTO周靖人在接受第一財經採訪時說,非常欣慰看到國內很多企業都在積極加入到開源的陣營裡。
“開源大模型的發展對開源社區、整個產業來講是絕佳的事情。”在周靖人看來,在模型基礎上怎麼做二次的創新對AI產業的發展至關重要,今天任何一個模型,要直接去解決當前業務的問題都仍有距離。模型的開源和開源社區的發展被視作推動AI產業創新的重要驅動力。
華爲今日也表示,此舉是華爲踐行昇騰生態戰略的又一關鍵舉措,推動大模型技術的研究與創新發展,加速推進人工智能在千行百業的應用與價值創造。
從成本角度來看,業界推測,百度、華爲之所以在此時選擇將相關大模型開源,意味着兩家公司已經將成本降得足夠低。此前李彥宏稱大模型推理成本正以每年90%的速度遞減。
開源的最終目標仍然是實現商業價值的轉化。儘管開源了大模型,開發者還可以選擇使用百度、華爲智能雲的算力服務來進行模型訓練、推理和部署。這意味着大模型廠商們仍然可以通過提供高級的企業級解決方案和定製化服務、API接口和雲服務等方式實現商業閉環。
對於開源閉源兩種路線,也有分析人士對記者指出,開閉源並存的路線共同構成了人工智能領域競爭與共生的多元環境,開源趨勢會促進和推動行業在這之上的商業化,快速迭代、快速試錯、共創共擔。但與此同時,業務場景、用戶觸達不能只靠開源。閉源模型核心邏輯在於能夠構成商業閉環,有大量的用戶反饋、在固定的渠道里形成壁壘,假設最終其能找到真正擊中用戶痛點的地方,且通過用戶的反饋能夠去提升能力,就能佔住一個賽道進行商業化變現。
打出開源牌的背後,對百度而言,應用纔是未來;對華爲而言,開源與追趕英偉達CUDA生態密不可分。
九章雲極的一名內部人士對第一財經記者表示,未來在 AI 算力領域,業界對英偉達的依賴或將逐步轉向多元化選擇,這種轉變不僅體現在推理環節的技術替代,更將延伸至訓練場景的全鏈條能力重構。
開源也伴生挑戰。有接近華爲人士對記者表示,開源雖帶來諸多好處,但也意味着其他企業和開發者可以基於盤古模型進行二次開發,可能會出現一些與華爲內部業務競爭的產品或解決方案。這意味着,華爲內部業務線需要持續地進行技術優化,從而保持自身的競爭優勢。 而對於同時擁有開閉源模型的百度來說,也有着類似的挑戰。
還有華爲內部人士認爲, To B項目的成敗跟軟件是否開源實質上關聯不大,本質上還是看廠商產品能力、交付能力以及對客戶需求的理解。但無論是誰,都無法忽視開源的力量,而業界圍繞場景落地的較量纔剛剛開始 。