DeepSeek終結“百模大戰” AI六小虎還坐得住嗎?|聚焦

《科創板日報》2月14日訊(記者 李明明)DeepSeek的爆火,引出了一個話題:中國的大模型創業圈會發生什麼樣的變化?

在技術層面,“爲什麼大模型六小虎沒有成爲DeepSeek”的質疑聲尚未平息,開源生態帶來的顛覆性效應已然顯現。多位業內人士指出,由於開源框架大幅降低技術門檻,“快則1個月,慢則3個月,國內大模型應該都能具備甚至超越準DeepSeek-R1的水平。”

水木清華校友種子基金合夥人王學輝對《科創板日報》記者表示,DeepSeek實際上帶來了AI平權,但技術追平後,更考驗大模型企業的市場化銷售、融資、資本運作能力,“比如A股上市的能力,這些也是核心能力。”

DeepSeek引發的基礎大模型價值重估,正在深層擴散。

開源生態帶來顛覆效應

“因爲開源和低門檻,我們預測快則1個月,慢則3個月,國內大模型應該都能具備甚至超越準DeepSeek-R1的水平。“這是《科創板日報》記者和多位投資人、人工智能業內專家交流時,對方的普遍看法。

英諾天使基金合夥人、北京市前沿國際人工智能研究院理事長王晟告訴《科創板日報》記者,DeepSeek並非技術遠超其他模型,其技術無本質創新,而是選擇了降成本、重落地的路線,在技術上限提升困難時凸顯優勢,引發行業思路轉變。

他表示,DeepSeek-R1是“一個很重要的時代的切換標誌”。當下AI的上升曲線已經變緩,預訓練的數據差不多用光了,大語言模型能力不容易再上升,只能轉換思路轉向以OpenAI的 o1和DeepSeek的 R1爲代表的推理模型。整個行業從“對標OpenAI”的宏大敘事轉向場景優先的實用主義。

英諾創新空間創始合夥人、清華校友總會互聯網與新媒體專委會秘書長鄧永強則告訴《科創板日報》記者,DeepSeek降低的是成本,而不是極大提升模型本身的性能,“就像小米的性價比要比蘋果高,但不代表性能比後者優越。事實上,國內外目前就有不少模型要比DeepSeek性能強,比如OpenAI o3、阿里的通義千問。”

由此可見,DeepSeek沒有發明新範式,但其重要意義在於幫助RL(強化學習)和test-time scaling(模型推理階段規模化)這一新訓練範式真正被大衆熟知。

《科創板日報》記者注意到,對標OpenAI o1,DeepSeek-R1採用的是後訓練模型,即test-time scaling(模型推理階段規模化),而此類模型的Scaling Law纔剛剛開始,還有着很大的上限。國內大模型廠商中同爲強化學習等後訓練方式的還有月之暗面kemik1.5、智譜GLM-Zero-Preview等,這些模型都於近期更新,且都注重推理和邏輯思考,擅長處理數理邏輯、代碼和需要深度推理的複雜問題。

一位頭部機構投資人告訴《科創板日報》記者,DeepSeek-R1用到的MoE技術,之前早有企業用到,技術上並無本質創新,後面很大概率有團隊會做出超越DeepSeek的模型。

“預計國內某些大模型企業後續也會發布與DeepSeek技術路線相似的模型。但從用戶量級和實際效果的角度,會不會像 DeepSeek如此成果顯著、市場叫好、上線後表現如何,還有待觀察。”

大模型“六小虎”三家留守AGI

DeepSeek的爆火無疑將導致大模型行業洗牌加速。事實上,大模型六小虎此前已經走向分化。

其中,零一萬物是第一家公開大幅調整發展方向的基礎大模型創業企業。李開復此前公開表示,零一萬物已與阿里雲成立 “產業大模型聯合實驗室”,零一萬物大部分訓練和 AI infra 團隊會加入該實驗室。這之後,零一萬物將不再追求訓練超級大模型。

就在今日,零一萬物產業大模型傳來最新動態:公司與蘇州高新區聯合成立的產業大模型基地正式授牌,基地將聚焦垂直產業,與中細軟集團、創新奇智、倍漾量化等產業鏈企業,探索大模型技術的產業化路徑。這意味着,零一萬物對產業化探索的進一步深入。

此外,零一萬物近日還宣佈,公司研發的海外 AI 應用PopAi接入了DeepSeek-R1模型。

百川智能則在2024年明確了走向醫療的賽道。近期公司CEO王小川更是下場做起了VC投資人,聚焦AI、具身智能、醫療等技術領域。

MiniMax將業務重點轉向了海外市場。其旗下的明星產品Talkie在2024年上半年成爲美國下載量第四的人工智能應用。但12月中旬,Talkie被蘋果應用商店下架。有知情人士對《科創板日報》記者表示,目前,海外監管正在加強對社交類APP的審查,“Talkie可能存在違反蘋果公司相關政策或海外政府的監管政策。”

前述投資人對《科創板日報》記者分析,從業務方向上看,上述三家大模型“小虎”已經不再將重點放在基礎模型的研發上,而是追求現有大模型技術在垂直領域的落地應用。“目前專注實現技術創新和追求AGI的可以說僅剩下智譜、月之暗面以及階躍星辰。”

對於將如何應對DeepSeek的衝擊,智譜方面對《科創板日報》記者表示,“在努力做Agent落地以及多模態發展。”

業務層面,智譜的To B定位明確,並跑在了行業領先的位置,同時也在加大對to C市場的開拓。1月23日,智譜正式上線GLM-PC。其是基於智譜多模態大模型CogAgent,爲面向公衆使用的電腦智能體。近日,三星宣佈最新款旗艦手機Galaxy S25系列將搭載智譜的Agentic GLM技術。

上述投資人表示,一定程度上,智譜開源生態會受到DeepSeek低成本開源模型的直接衝擊,“但智譜一直在做B端私有化部署,爲大型國企定製解決方案,2024年商業化收入增速150%,B端的護城河還是較深的,而且B端用戶是最具付費能力的。”

而月之暗面方面,《科創板日報》記者從知情人士處瞭解到,將繼續攻堅先進技術,做好Kimi這個產品本身。

2月12日,OpenAI發佈了關於推理模型在競技編程中應用的研究論文報告,其中提到,DeepSeek-R1和Kimi k1.5通過獨立研究顯示,利用思維鏈學習(COT)方法,可顯著提升模型在數學解題與編程挑戰中的綜合表現。

“在技術領域,實際上Kimi的閉源模型Kimi1.5受到業內認可,但由於閉源模型本身的限制,在輿論上可能被deepseek壓制。”上述投資人進一步表示,“目前DeepSeek還只聚焦大語言模型,實際上並沒有將業務拓展到多模態領域,而且其v3模型主要在數學和代碼等能力方面比較突出,其他通用類文本生成、理解等方面效果還有提升空間。”

“六小虎”中最低調的階躍星辰,則在近期發佈了Step-1o Vision多模態理解大模型。據瞭解,Step-1o系列是階躍星辰研發的端到端文本、視覺、語音三模態生成理解一體化模型。

上述投資人對記者表示,階躍星辰一向低調,但背後有曠視聯合創始人、CEO印奇以及原微軟全球執行副總裁沈向洋的支持,同時還有上海國資扶持,技術上很有潛力,“但如何在技術和市場中尋求平衡,會不會成爲政策導向型的樣板工程,可以觀察後續發展。大模型領域目前乾坤未定,尚未形成絕對的護城河,仍處於發展的早期階段。”

泥藕資本投資總監舒軼夫對《科創板日報》記者總結,DeepSeek對包括“六小虎”在內的其他大模型的衝擊是巨大的,各家都在採取不同的應對策略,主要包括:

一、加強技術創新,例如OpenAI推出o3-mini;二、開源,OpenAI開源了gpt-3.5,也承認了OpenAI的閉源策略可能存在缺陷;三、戰略合作和併購,例如零一萬物和阿里的合作。四、深耕特定領域或垂直方向,例如MiniMax的Talkie,或者如百川智能專注醫療教育等垂直行業;五、強化用戶體驗,包括長文本、多模態、硬件結合等。

王晟表示,其他大模型廠商可能會繼續走向分化,“如果要繼續卷基礎大模型,還是需要更高的投入。雖然DeepSeek現在是做的比較好,但是如果往GPT5級別的大模型走,肯定還需要更多的算力。”OpenAI CEO山姆·奧特曼近期宣佈,OpenAI將數月內推出GPT-5。

燧原科技高級總監何萬青博士則告訴《科創板日報》記者,“AI大模型產業是一個生態環境,蓬勃發展鬱鬱蔥蔥纔是最終目的,陽光、雨露、運氣都可能讓一棵大樹如DeepSeek脫穎而出,但是更重要的難道不是整個森林的生態繁榮?這個市場容得下多家大模型企業,各家其實做的業務都有差異化。”

地方國資可能撐起大模型後續融資

除了技術路線和業務模式上的重構,大模型創業企業的資產價值也面臨重估。大模型研發過去耗資巨大,DeepSeek帶來的研發成本降低,或動搖是資本市場對大模型創業企業的估值。

水木創投合夥人張靜告訴《科創板日報》記者,DeepSeek的出現對大模型企業的估值會產生較大影響,由於成本大幅下降,估值可能要下降,對後入局者會產生兩種影響,一是競爭加劇,讓後入局者更加困難;另一方面也可能促使一些具有獨特技術的企業“輕鬆”入局,因爲訓練成本下降。

王晟對此則呈較爲樂觀的態度,他認爲,此前大模型獨角獸動輒數十億的融資導致“血條較厚”,還可以撐一段時間。“另外,因爲大模型代表最先進的AI能力輸出,也代表新質生產力,所以地方政府對此非常看重,大模型及背後資金的競爭,在某種程度上,已經上升到了城市發展戰略及產業規劃之爭,大模型獨角獸所在城市和國資很大概率上還會繼續支持。畢竟DeepSeek雖然很強,但是總部只能落在一個城市。”

值得一提的是,DeepSeek的現象級崛起也引發創投行業反思:此前投出大模型“六小虎”的創投機構爲什麼集體錯過?

水木資本董事長唐勁草對《科創板日報》記者分析稱,投資人集體錯過DeepSeek的原因是多方面的:一方面,DeepSeek自身的低調、獨立性以及資金充足、對商業化興趣不大的態度使其未能吸引到足夠的外部投資;另一方面,中國VC的偏好、市場對高估值項目的擔憂以及外部環境的變化也對其融資造成了阻礙。這些因素共同導致了DeepSeek在早期階段未能獲得更多的投資支持。

抱持樂觀主義的投資人、創業者,則已經將目光放到了DeepSeek帶來的AI行業生態變化可能造就的AI應用爆發。

面壁智能CEO李大海告訴《科創板日報》記者,DeepSeek打破了算力壟斷的神話,高效低成本路線,深耕原始創新釋放巨大的勢能,“DeepSeek出來後,其實我們的信心更強了,更篤定了我們的預判和方向。”據悉,面壁智能亦一直篤信開源的價值。

水木清華校友種子基金合夥人王學輝則表示,未來一定會產生各種AI應用,“但真正的超級應用,一開始一定會像當年的BAT、後來的抖音、拼多多一樣,從看不見到看不起、看不懂最後追不上。”