DeepSeek-R2發佈前,熱鍋上的“四小虎”
出品|搜狐科技
作者|樑昌均
編輯|楊 錦
在DeepSeek引發市場對“大模型六小龍”的價值質疑半年後,還在堅持做大模型的玩家意圖向外界證明自己依然很能打。
從上海的MiniMax到北京的月之暗面,接連推出多款模型和產品,“卷”得厲害。
它們不約而同地把DeepSeek、OpenAI、谷歌等最新最強模型作爲對標,並都瞄向了同一個方向——國內外巨頭都在佈局的智能體(Agent)。
MiniMax和Kimi的久違更新,是對外界質疑的一次迴應,也透露出這兩家企業仍想繼續留在牌桌上的努力,其中MiniMax還爆出計劃上市。
嚴格來講,“大模型六小龍”的陣營已經崩盤,零一萬物和百川智能放棄基座模型訓練,咬牙堅持的“四小虎”——智譜、月之暗面、MiniMax和階躍星辰,還在試圖突圍。
資本狂飆之後,這些被迅速催熟的獨角獸,面臨技術和商業的雙重挑戰。有曾在其中一家獨角獸工作過的人士認爲,接下來或還會有1-2家掉隊。
猛發模型的MiniMax和Kimi
“第一次感覺到大山不是不能翻越”“又躍過了一條河”“越來越強烈地感受是AI的價值可以開始被經濟衡量”……
MiniMax最近發佈周的每次更新,創始人&CEO閆俊傑總會發出不少感悟,而引發他“大山不是不能翻越”的點是——MiniMax首款開源推理模型M1。
根據基準評測,這款參數達4560億的模型性能接近海外最領先模型,部分任務超過DeepSeek、阿里、OpenAI、谷歌等最新最強的開閉源模型,尤其是在軟件工程、長上下文、工具使用等複雜生產力場景中優勢明顯。
在海外權威機構Artificial Analysis最新發布的模型綜合能力榜單中,MiniMax M1位列全球開源模型第二名,僅次於DeepSeek-R1-0528,躋身全球第一陣營。
月之暗面同樣發佈了k系列模型的最新版本Kimi-Researcher,其是基於端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代Agent模型。
在覆蓋上百個專業領域的高難度基準人類終極考試(HLE)中,Kimi-Researcher取得26.9%的Pass@1分數,超過OpenAI o3、Gemini 2.5 Pro、DeepSeek-R1-0528和Claude 4 Opus。
搜狐科技注意到,此次MiniMax和月之暗面在模型層面的突破,背後是對強化學習的重視和算法創新。
M1在進行大規模強化學習時,採用Lightning Attention(閃電注意力)混合架構與創新性的CISPO算法,從而提高了訓練效率,擴展了模型性能。
Kimi-Researcher則採用端到端自主強化學習技術,用結果驅動的算法進行訓練,擺脫了傳統的監督微調和基於規則制或工作流的方式。結果顯示,探索規劃步驟越多,模型性能就越強。
早在去年o1發佈後,月之暗面創始人楊植麟就表示,強化學習是接下來AI的發展方向。隨後推出k0-math、k1.5等推理模型,Kimi-Researcher仍是強化學習這條路線的延續。
“真正具備自適應性的通用智能,需要在真實任務的交互與反饋中成長出來。”月之暗面對選擇端到端強化學習的技術方式解釋到。
同時,新一波的大模型技術競爭也已放棄單純追求參數、算力規模的傳統範式,在推動模型SOTA的過程中,捲成本和效率成爲趨勢。
DeepSeek此前就將這種高性價比優勢充分發布出來,併成爲效仿策略。此次的M1藉助算法架構創新,強化學習訓練過程比DeepSeek-R1 算力消耗更低且效率更高,380萬元的成本比預期少了一個數量級。
此外,走向多模態、選擇開源也成爲越發重要的競爭策略。從最初的語言模型,到多模態,“四小虎”全面追趕競賽,並均走向開源,這很難說不是受到DeepSeek的影響。
競逐智能體風口
隨着此次MiniMax和Kimi的發佈,意味着“四小虎”均涉足Agent領域。
今年被普遍視爲Agent元年,搜狐科技瞭解到,不少AI初創企業自去年改變方向,轉做智能體,甚至有企業迅速在B端做到千萬級訂單。
但面向C端的智能體,還沒有哪款產品能牢牢佔據用戶心智,此前爆火的Manus尚未在國內上線,這意味着仍有機會。
此次月之暗面發佈的Kimi-Researcher集模型和智能體於一身,定位於專爲深度研究任務而生的智能體,而不是所謂的通用智能體。
一位AI從業者認爲,Kimi-researcher帶來了一種不同思路的解決方案,其它智能體大多采用Claude的multi-agent(多智能體)方案,通過寫很多Workflow(工作流)去做,Kimi則是少有的基於自身模型採取Single-Agent(單智能體)路線。
這與OpenAI基於o3推出的DeepResearch思路相同,而Manus則基於Claude+Qwen模型,核心是多智能體系統。該公司創始人肖弘曾稱,Claude是做智能體的最佳模型。
這代表了兩種不同的思路。有觀點認爲,隨着模型越來越強大,建立在外部模型之上的智能體的能力將被模型吞噬。但由於不用自研模型,這種方式成爲不少創業企業的選擇。
“Manus、Genspark、Skywork、Flowith等這些智能體都是多個模型,體驗差異感覺不是很大。在審美場景,如前端頁面,目前Claude最靠得住。”有大模型企業關注智能體的高管表示。
月之暗面研究員Flood Sung此前認爲,各種Agentic Workflow就是各種帶Structure的東西,它一定會限制模型能力,沒有長期價值,早晚會被模型本身能力取代掉。
因此,月之暗面的做法是讓Agent的能力進入到模型本身,並完全依靠強化學習訓練,打破傳統智能體採取的工作流拼裝或監督微調方式存在的固定流程和數據限制,讓模型更加靈活通用,並用其自主生成的數據去探索上限。
前述高管認爲,模型即Agent這種思路往往是模型廠商的選擇,想要開發出所謂的通用智能體,意味着模型本身要夠強,意味着這需要投入大量資源去做基模研發。
不過,MiniMax此次發佈的適用於長程複雜任務的通用智能體,底層並未採用單一模型。該公司稱,這造成了一定的使用成本,正努力研發更高效、成本更低的方案。
搜狐科技瞭解到,MiniMax Agent和月之暗面不同,採用的是自研+外部模型。“它們還是有很多工程和國外模型的痕跡,但其能力很強,不弱於那幾個比較火的Agent。”體驗過這款智能體的前述高管表示。
對MiniMax和Kimi來說,通用智能體都是最終目標。目前,Kimi-Researcher還是專注於搜索和推理的智能體,月之暗面希望未來能向着可以解決廣泛複雜任務的通用智能體進化。
智譜和階躍星辰則更早就在發力智能體,但給外界的感覺是更側重B端落地。智譜已和榮耀、華碩、小鵬、高通、英特爾、三星等等達成智能體合作。
階躍則與Oppo、吉利、千里科技等企業達成合作。最近,曠視科技創始人印奇入主的千里科技還與該公司聯合研發推出智駕模型。
“現在的趨勢業內沒啥爭議,區別只是誰做得更快。”無論是選擇自研模型,還是外部模型,選好更能達到目標的技術路線,並更快做出讓用戶或企業認可的產品,纔是關鍵。
都想要留在牌桌上
MiniMax和月之暗面的系列新品,一定程度上代表了它們對技術和未來方向的探索,更是一次想要留在牌桌上的證明,但僅僅是這些恐怕還不夠。
搜狐科技從“四小虎”中的一些員工處獲悉,智譜、月之暗面等還在憋大招,“智譜可能還有兩次機會,Kimi就這一次了”。
“DeepSeek出來後,這些企業的故事講不下去了。”有員工認爲,像智譜原來覺得自己是國家隊,但現在可能這種地位都保不住了。
該人士強調,現在基模仍很關鍵,如果做出來厲害的模型,市場格局可能又會發生變化。但無論是算力資源還是資金,這幾家企業相比DeepSeek都沒有太大優勢。
同時,現在從各種評價、榜單、用戶,以及從API調用趨勢來看,DeepSeek還是非常領先,“能與之扳手腕的可能就只有字節,阿里都有點趕不上了”。
自去年以來,大模型就已進入規模定律邊際效應遞減的瓶頸期。接下來,OpenAI和DeepSeek這兩家國內外的領頭羊,被視爲重要的風向標。
奧特曼最近透露,OpenAI即將推出開源模型,並在今年夏天發佈多模態模型GPT-5,DeepSeek何時推出R2也頗受關注。
最新報道稱,R2很可能不會在短期內發佈,原因在於樑文鋒對R2現在的性能還不滿意,工程師團隊仍在全力優化和打磨,部分原因受到算力影響。這意味着R2仍在謀求遠超前代的性能,屆時“四小虎”如果停滯不前,壓力無疑會更大。
變局之下,“六小龍”變動頻繁,今年超十多位高管出走,其中智譜就有4名高管離職,包括負責商業化的張帆、負責戰略融資的張闊等,其它企業也出現了聯創或副總裁等高管離開的局面。
月之暗面則基本放棄大規模投流策略,產品用戶增長和交互有所下滑。該公司還被爆出推出類似於小紅書的AI內容社區,從而增加用戶黏性,但還未正式上線。
搜狐科技瞭解到,月之暗面今年重心迴歸模型研發,下半年會推出新一代多模態大模型,並與智能體結合;商業化則維持現狀,其內部資金還能維持三年左右。
堅持多模態且開源的階躍星辰也有所收斂,角色扮演類產品冒泡鴨停止大範圍投入,聚焦Agent方向,發力模型研發,包括強化學習和多模態的理解生成一體化。
MiniMax則宣佈品牌拆分,ChatBot產品海螺AI更名MiniMax,海螺AI專指視頻生成。隨着智能體推出,該公司形成Agent、Talkie/星野、海螺AI爲核心的產品矩陣,並繼續發力出海。
“AI視頻產品的需求已得到初步驗證,國內外都會有較大前景,MiniMax做得相對較好,肯定會繼續發力。”有AI從業者稱。一個例證是,快手的可靈AI今年一季度營收達1.5億元。
值得關注的是,此次MiniMax發佈週期間,還被爆出謀求港股上市。媒體援引知情人士稱,其內部有類似想法,但還在初步籌備階段。
這是繼智譜明確開啓上市進程之後,國內第二家傳出計劃上市的AI獨角獸,而智譜也被認爲是最有希望最早“上岸”的獨角獸。
今年以來,智譜從北京、杭州、珠海、成都等地方國資獲得20億元融資,且拿到不少政府訂單,從上市加速推動商業化。
“雖然要上市,但我們內部感覺還是很有壓力。就算上市也不一定代表安全,能不能保持現有估值是很大挑戰,而且很多核心信息都會公開。”有智譜員工對搜狐科技表示,今年智譜也減少了推廣投放,重心在於基模和拿訂單。
如同此前包括商湯在內的“AI四小龍”一樣,上市遠非終點。無論是技術方向的變化,還是難以跑通盈利的商業化,依然是這波大模型企業需要應對的挑戰。
有曾在“四小虎”工作過的離職人士認爲,未來可能還會有1-2家掉隊,最後僅剩2-3家存活下來。李開復更激進,認爲國內大模型會收斂到DeepSeek、阿里和字節三家企業。
這三家企業基本是行業公認的國內大模型第一梯隊,“四小虎”們還得往後站,它們的窗口期也越來越窄。
“商業化幹不過豆包等大廠,開源比不過DeepSeek”,是它們面臨的尷尬處境。過去以及現在所做的調整,可能會決定他們未來的命運走向。
運營編輯 |曹倩審覈|孟莎莎