2025AI中場戰事:誰在撤退,誰在進攻?

目前,國內AI大模型市場由“百模大戰”逐漸進入淘汰整合的中場階段。

歷經2023年以來的“百模大戰”和資本狂熱,行業格局正逐步清晰。曾經百家爭鳴的局面已經洗牌,今天的舞臺由新老巨頭與新晉獨角獸兩大陣營主導。

在頭部技術路線和商業化落地上,老牌互聯網巨頭和“新BAT”——以百度、字節跳動、阿里、騰訊、爲代表,搶佔先機;同時涌現出的“基模五強”——字節跳動、阿里、階躍星辰、智譜AI、DeepSeek等也在全線發起進攻。

這些巨頭與獨角獸們在模型創新、算力投入、生態佈局、開源策略等方面各有打法。與此同時,“AI六小龍”的處境卻出現分化,有的已開始收縮陣腳。

距離ChatGPT發佈僅過了2年,從巔峰時期的300家大模型同臺競技到洗牌至以月之暗面、MiniMax、智譜、階躍星辰、零一萬物、百川智能爲代表的“大模型六小龍”。他們曾雄心勃勃追趕OpenAI的腳步。

然而當前,隨着巨頭勢力全面加持,技術門檻和成本壁壘不斷攀升,“小龍們”的生存空間正在被擠壓。同樣重要的是,新一輪AI攻勢還催生了一批規模巨大的玩家。

字節跳動、阿里爲代表的巨型互聯網公司紛紛在大模型領域加大投入,各自佈局了大型AI中臺和應用生態。和他們並肩作戰的,還有新崛起的階躍星辰、智譜AI、DeepSeek等明星級創業團隊。這些“新基模五強”爲主的玩家各顯神通,掀起了又一輪技術與市場競爭。如今戰線已從前沿算法逐步向商業化與生態落地轉移,價格戰與應用場景爭奪成爲新的焦點。

一、高築牆,廣積糧,新老BAT兇猛

在這場AI博弈中,巨頭陣營的攻勢格外兇猛。

字節跳動在這一輪洗牌中保持了穩紮穩打的進攻態勢,近年推出的“大模型家族”,如豆包系列模型,在多模態理解與生成上持續升級。最新的豆包通用模型(Doubao-Pro)在公開評測中已與GPT-4系列看齊。字節還針對不同應用場景不斷優化模型結構,今年公佈的視覺理解模型和種子級文本、語音、音樂等專用模型,使其在語言、視覺、聲音等多模態任務上都保持行業領先。

更重要的是,字節對AI商業化投入巨大,豆包系列在公司內部50多個業務場景中大規模上線,日調用量已突破4萬億tokens,7個月增長33倍之多。

不僅如此,爲了搶佔市場,字節還大膽降價,力推“釐時代”。2024年5月,豆包通用模型首度對外發布時定價僅0.0008元/千token,比行業均價低99.3%;年底再推視覺理解模型,價格僅0.003元/千token,比行業價低85%。這一輪降價風暴在火山引擎AI大會上一舉打響,字節相關負責人透露:“5月豆包日調用量1200億,此前已飆升到4萬億”。

同時,跌價帶來的正向循環迅速顯現,底層算法實力加上億級用戶生態(抖音、頭條、飛書等),使豆包迅速形成覆蓋千行百業的閉環。

字節還通過開放開發平臺“釦子”集聚開發者,目前已有百萬活躍開發者參與構建了200萬智能體,全面鋪開AI應用生態。綜合技術實力、資金、生態三者,字節已成爲AI賽道的領跑者之一,其打法可總結爲“更強模型+更低價格+更易落地”。

阿里作爲開源最早、最完整的大公司,在AI的投入上也最堅決。

截至目前,通義團隊累積開源200多款模型,涵蓋了千問(Qwen)大語言模型和萬相(Wan)視覺生成模型兩大基座系列。在4月底,阿里發佈的最新“千問家族”Qwen3 系列模型,包含 0.6B 至 235B 規模的多款模型(包括兩款 Mixture-of-Experts 大模型),並選擇將模型完全開源。在性能方面,Qwen3 小模型(4B 參數)可以達到上一代 Qwen2 大模型的效果,而 Qwen-3 系列整體在多模態和推理上有顯著提升。整體佈局,正如馬雲所言,“AI 不是選擇題,而是阿里的必答題”。

配合新模型,阿里還在雲服務端積極降價搶市場,2024 年,阿里已將多款大模型推理價格砍至原價的3% 左右,並在 2025 年繼續降價。阿里通過開放模式與鉅額補貼雙管齊下,一方面開放底層模型以吸引全球開發者關注,另一方面下調成本激發生態活力,反映了持續投入的決心。

騰訊在大模型領域的戰略和部署同樣持續進化。

4月份,騰訊對其混元大模型研發體系進行了全面重構,圍繞算力、算法和數據三大核心板塊,刷新團隊部署,加碼研發投入。調整後,騰訊成立兩個新的部門:大語言模型部和多模態模型部,分別負責探索大語言模型和多模態大模型的前沿技術,持續迭代基礎模型,提升模型能力。騰訊官方人士表示,此舉旨在優化研發流程、整合資源,以應對大模型時代日新月異的挑戰。

此前,騰訊已經將元寶、ima、QQ瀏覽器、搜狗輸入法等幾大AI產品線整合,提出“核心自研+擁抱開源”的AI策略。具體來看,騰訊自研的混元模型多模態性能強勁。今年推出的“快思考”Turbo S模型和“深度思考”T1模型,在公開基準上均達業界領先水平;在視覺、3D生成領域,騰訊也開源了多款模型(如混元3D生成、混元視頻生成、文生圖DiT、千億參數混元MoE模型等),這些模型在GitHub上收穫了近3萬星標。混元模型已深度嵌入微信、QQ、騰訊會議、騰訊文檔等產品,提高了用戶端的智能化體驗,同時通過騰訊雲向外輸出能力,助力合作伙伴創新提效。

值得注意的是,據騰訊2024年四季度及年度財報顯示,騰訊研發投入再次創下歷史新高,達到707億元,這爲其大模型技術攻關提供了雄厚後盾。在持續的中場博弈中,騰訊憑藉底層算法實力、開源影響力和全域生態的輸出,構築了獨特的防線和進攻點。

同樣,作爲老牌互聯網巨頭,百度在2025年上半年持續加碼大模型研發與開源,以“文心大模型”4.5系列爲核心,先後推出並免費開放 ERNIE 4.5 和深度思考 X1,其性能在多模態理解和推理能力上已全面超越同級競品,且通過 Turbo 版本將推理成本分別降低至 0.8 元和 1 元/百萬 Token。

市場應用層面,文心一言平臺自4月全面免費後,用戶規模迅速攀升至 4.3 億,日均調用量突破 15 億次。未來 ERNIE 5.0 的推出,預計在多模態融合與推理效率上進一步革新。

在產品與生態層面,百度已將大模型能力深植搜索與智能助手,先後上線“AI搜”智能檢索服務和通用智能體 App“心響”,覆蓋知識問答、文檔處理、旅遊規劃等百餘場景,並通過開放 API 吸引開發者創新。

二、新銳突圍,基礎大模型格局再洗牌

除了“新老BAT”外,一些大模型初創企業同樣展開全面進攻。

上海獨角獸階躍星辰作爲新興力量,今年來動作頻頻。2024年末該公司完成B輪融資數億美元,由上海國資領投、騰訊等戰略投資者跟投。官方披露,融資將繼續用於核心大模型的研發,特別是強化多模態和複雜推理能力,並通過產品生態進一步滲透C端市場。

今年2月,階躍星辰開源發佈了其性能最強的兩款多模態模型:其中“Step-Video-T2V”擁有300億參數,能生成204幀、540P高質量視頻;“Step-Audio”在多項公開語音評測中超越業內同類開源模型,尤其在漢語六級水平考試中表現突出。

據瞭解,成立不到兩年、團隊500餘人的階躍星辰,在迭代了11個模型後躋身“AI六小虎”行列,並被《麻省理工科技評論》評爲“中國值得關注的四家AI創業公司之一”。公司高管透露,團隊中算法和技術人員佔比接近八成,創始人姜大昕爲微軟前高管、IEEE Fellow入選者,首席科學家張祥雨則爲ResNet論文合著者。這些“高密度人才”正支撐階躍星辰在多模態技術上的狂飆突進。

與此同時,來自清華學府的智譜AI也高速擴張,並已啓動上市進程。今年4月,智譜AI正式在證監局備案輔導(中金公司爲輔導機構),標誌着其成爲國內首家進入IPO流程的大模型創業公司。

智譜AI自2019年成立以來,一直專注認知智能大模型研發。該公司與學術機構合作打造了中英雙語千億參數預訓練模型GLM-130B,並基於此推出了對話模型ChatGLM及其開源版本ChatGLM-6B。

除通用模型外,智譜還推出了多模態和行業應用組件:包括AI助手“智譜清言”、高效代碼生成模型CodeGeeX、視覺語言理解模型CogVLM、文生圖模型CogView等。商業模式上,智譜主張“模型即服務(MaaS)”,已建成AI開發開放平臺,爲政府和企業提供私有化部署和智能體解決方案。

據官方介紹,其MaaS平臺已支持百萬量級開發者,與全球多家車廠、終端廠商合作,將大模型從“聊”引向“行”。憑藉深厚學術背景與產業合作,智譜AI正力圖成爲“基座模型”領域的領軍企業。

在這陣營中,DeepSeek的聲音當然也不容忽視。DeepSeek團隊非常低調,但技術打法極具衝擊力。他們專注於語言模型、尤其是數理邏輯能力,並秉持堅定的開源策略。今年農曆春節期間發佈的DeepSeek-R1模型,以遠低於常規的算力投入,實現了與GPT-4等頂級模型媲美的性能。

業內分析認爲,DeepSeek在訓練方法上的創新纔是關鍵:其採用的Mixture-of-Experts架構使模型參數總量達6710億,但運行時只激活37億參數,大幅降低計算需求;多Token預測和“潛注意力”等技術也極大提升了效率。

簡言之,DeepSeek走的是偏科研的路線,不急於變現,團隊以頂尖新秀爲主、規模精簡,將更多資源投入算法優化。正因如此,一度被忽視的DeepSeek一經開源便引爆關注,據報道,其App已突破3000萬日活,成史上最快登頂的AI應用之一。投資者與同行也紛紛圍攏,例如新浪財經報道,“DeepSeek-R1開源後,衆多業內人士重新審視DeepSeek的技術實力,私募紛紛嘗試接觸其創始人樑文鋒”。DeepSeek通過極致的工程優化與開源創新,已悄然建立起自己的競爭優勢。

總體來看,以字節跳動、阿里巴巴、騰訊爲代表的新BAT,以及階躍星辰、智譜AI、DeepSeek等新興主力,構成了當前中國AI“大模型”賽道的進攻重兵。他們在技術研發、人才儲備、資金投入和市場開拓上全面發力,推動着AI技術不斷向世界前沿靠近。在這種格局下,大公司的優勢在於資源與生態整合,而創業公司則更強調創新與專注,各有千秋。

三、退守與聚焦,AI六小龍瓦解

相比之下,“AI六小龍”——曾被寄予厚望的創業小企業,則出現了明顯分化。

以李開復創辦的零一萬物爲例,2025年伊始便曝出要將預訓練團隊出售給阿里的傳聞。儘管李開復闢謠稱並非出售,但他已承認“目前只有大廠能持續投入超大規模模型訓練”。公司大幅調整方向,主動與阿里雲合作成立“產業大模型聯合實驗室”,將預訓練算法團隊和基礎設施團隊交給阿里,專心做小參數高性價比模型。他坦言:“我們不再做超大模型,不是因爲不相信 Scaling Law,而是把這件事交給能做的大公司來做,我們跟他們合作,這纔是生存之道”。

零一萬物開始放棄自行訓練萬億參數模型,轉向針對電商直播、會議等場景的行業智能應用,推出 AI 數字人和“Yi”系列服務。雖未立刻倒閉,但其已清晰地從“造基座”往後撤步,調整爲聚焦落地應用。

同樣,百川智能也顯示出戰略調整跡象。2024 年 7 月宣佈完成 50 億元人民幣 A 輪融資,估值約 200 億元,投資方包括阿里、騰訊、小米等互聯網巨頭。百川主打醫療方向,大模型“百川-53B”於 2023 年底問世,AI 助手“百小應”上線,曾在 2024 年 WAIC 展臺展示醫療問診應用。

而今年3 月中旬就有媒體爆出,百川兩位聯合創始人已經確認離職。股權回購與融資併購也傳出爭議。此外,王小川在內部信中提到了成立兩年來百川智能的不足,稱公司“兩年來戰線拉得太長、不夠聚焦”,公司前後已經裁撤部分 ToB 金融部門,將重心迴歸醫療專家模型和百小應產品。可見百川雖依然獲得資金支撐,維持產品更新和生態拓展,但內部正在精簡業務以求聚焦。

月之暗面近期明顯收緊打法,縮減燒錢戰略。春節後有媒體披露,在DeepSeek攻勢之下,月之暗面決定大幅壓縮市場推廣預算,暫停多款安卓渠道投放並解除第三方廣告合作。公司內部將此歸因於“外部環境變化和戰略調整”,表明其營銷打法將更加謹慎。

此前,月之暗面曾以廣撒網的方式重點推廣AI助手Kimi,也在海外推出Ohai、Noisee等產品。但根據晚點財經報道,月之暗面今年9月已決定停止Ohai和Noisee的運營,將資源集中在覈心產品Kimi。有兩位負責海外產品的高管離職創業,創辦了定位於AI編程的公司。這些動向與資本市場的謹慎形成對照,不難看出,這家曾估值近25億美元的獨角獸在戰術上更加聚焦,降低了非核心業務拓展的投入。

而MiniMax的路徑選擇就顯得既謹慎又富有張力。這家曾因創始團隊出身商湯而備受矚目的公司,早期憑藉Talkie這類情感陪伴類應用快速打開海外市場,日交互量一度突破30億次,但如今卻面臨用戶增長乏力、留存率下滑的困境。當賽道瓶頸逐漸顯現,MiniMax繼而調整策略,逐漸淡出同質化嚴重的情感陪聊紅海,轉而將資源向視頻生成、音樂創作等更具技術壁壘的領域傾斜。

MiniMax作爲國內首個自主研發MoE混合專家架構的團隊,他們早已不滿足於單一模態的較量,而是構建起覆蓋文本、語音、圖像、視頻的全矩陣模型體系。

產品佈局上,MiniMax採取To B與To C雙線並進的策略。To B端通過開放平臺接入3萬家企業,覆蓋客服、教育等標準化場景以降低邊際成本;To C端則依靠星野、Talkie等情感陪伴應用積累日均30億次交互數據,但面臨用戶增長放緩、付費能力有限及海外監管風險。近期推出的海螺AI試圖以文生視頻、音樂生成等特色功能突破同質化競爭,但滲透率仍需提升。

今年3月,MiniMax雖獲6億美元A + 輪融資,旗下Talkie應用日交互量超30億次,卻仍未找到穩定盈利模式。儘管有大量資金注入且產品有一定用戶活躍度,但MiniMax在盈利模式上尚未取得突破,目前仍在不斷嘗試和調整,以在競爭激烈的市場中找到可持續發展的道路。

總的來看,AI創業“小龍們”的走勢已有顯著差異,但是,這種趨勢並非敗退,而是行業成熟期必然的理性回調,最終目標是在巨頭夾縫中守住“小而美”的生存空間。

相反,以字節、阿里、騰訊爲首的重量級玩家由於資金、人才、生態和數據積累優勢,正處於中場競賽的主動位置。未來誰能在“智能上限”和“多模態能力”上取得突破,還有待考驗。

但可以肯定的是,這場“中場戰事”已經由此前的狂飆突進轉向穩紮穩打的比拼,各路玩家都在砥礪技術、優化策略,一方面力圖保留優勢,一方面尋求新的成長路徑。要知道,“大模型的路要跑得清楚,最終還得落到產品上”,誰能走得更久、更穩,將決定這場AI競賽的下一階段格局。