DeepSeek正在殺死國產大模型

中國創業公司的3年存活率,大約是10%,AI創業公司只會更低,DeepSeek的出現,加速了國產大模型公司的生死戰。短短的兩年半,從“百模大戰”到“十模共生”,就連被給予厚望的大模型“六小虎”,其中兩虎已經宣佈退出基模的研發。國產大模型公司之間的競爭相當慘烈,並且還沒有到終局,本文就來聊一聊,近期對大模型產業的觀察與思考。

01 基礎大模型,開始進入可用階段

1、Agent爆發,標誌着基模進入可用階段

人工智能科學家吳恩達 , 曾提出Agent的四個核 心要素:反思、工具調用、規劃和多智能體協作。 比如,一個電商 Agent 能根據用戶需求自動比價、生成購物清單、跟蹤物流;一個醫療 Agent 能分析病例、輔助診斷、制定治療方案 ,等等 。 而 Agent 的核心能力“反思”, 本質上 則是 依賴大模型的推理和深度思考能力 。

2025年被稱爲Agent元年, 各種 Agent 已 遍地開花, 從釘釘智能客服,到字節的扣子空間,再到百度心響App,以及剛剛融資5億的Manus。 Agent 興起 不僅僅是一個趨勢,更是基礎大模型能力達到一個臨界值的標誌。 只有 大模型具備了足夠強的理解、推理和決策能力,才能支撐 起現實 世界中的各種應用場景 。同時這 也意味 着 , 基礎 大模型 開始從 研究 、 炫 技 階段,邁入 可用、 產業化的新階段。

2、基礎大模型公司,不超過3家

李 開復 曾 公 開表示, 最終基礎大模型公司可能也就2-3 家,其實道理很容易理解, 基礎大模型是典 型的技術密集、資本密集、數據密集型行業,壁壘極高,馬太效應非常明顯。 訓練一個頂尖大模型,動輒需要上萬張高性能GPU,數月 乃至更久的訓練時間,海量的優質數據,以及頂尖的算法科學家團隊。這樣的投入,堪比“軍備競賽”,小玩家根本上不了牌桌 。 這 一特點 也 基本 註定 基礎 大 模型 的 終局 ---- 只會留下極少數的基礎大模型“ 寡頭 ” 。

02 盤點國內“第一梯隊”基礎大模型

根據K 哥的觀察以及行業內的普遍共識,目前國內 基礎大模型 第一梯隊玩家 ,大致 有以下幾 家:

1、阿里Qwen:開源生態的 “基建狂魔”

阿里的通義大模型佈局全面,通義系列模型從 0.5B 到 110B 全尺寸覆蓋, 阿里 Qwen 系列已開源 200 餘 個 模型,全球下載量超 3 億次, Qwen 衍生模型數超 10 萬個,已超越美國 Llama 成爲全球最大的開源模型 , 開發者生態規模僅次於 Hugging Face 。 這種 “開源獲客 - 商業版變現” 的模式,跟 安卓系統 的生態邏輯,有異曲同工之妙 : 通過免費開源吸引開發者、建立技術品牌影響力,再通過企業版、定製化服務盈利。

比如, 淘寶用通義千問優化 推薦算法, 有效 提升用戶轉化率 ;夸克推出的 AI 作業助手,覆蓋 K12 教育場景 。更關鍵的是,阿里 雲未來 三年投入 3800 億建設 AI 基礎設施,自 研 的“光系列” 芯片和液冷數據中心,爲模型訓練提供了底層保障,讓大模型成爲水電煤一樣的 基礎設施,也讓自己的 全 棧 技術佈局 ,成爲別的企業難以逾越的 護城河 。

2、深度求索DeepSeek:用工程創新 “掀翻桌子”

火爆出圈的 DeepSeek ,則是 憑藉驚 豔的工程創新,在大模型江湖殺出一條獨特血路。它搞出降 秩 KV 矩陣,搭配混合專家架構,參數數量直接砍掉約 60%, 算力消耗 大幅削減,訓練成本低至行業頭部模型的 1/10。還有它的 GROP 算法強化學習,跳過傳統 SFT 微調,用 “模糊思考 + 精確證明” 的訓練套路,讓數學、代碼生成任務上表現無可挑剔,在 LMSYS Org 榜單奪魁。

更具前瞻性的是 DeepSeek 的開源策略 , 不僅 構建起 了 以中國爲圓心的全球 AI 生態,還在其他公司 追求“更大更強” 之際 , 用自己的技術實力和戰略眼光開闢了 “更省更快” 的新賽道,直接“顛覆” API 定價 , 把 AI 服務從高端“奢侈品” , 變成大衆用得起的 “日用品”。

3、字節豆包:流量加持的“全能選手”

字節的 AI 戰略帶着鮮明的 “張一鳴烙印”: 低調佈局,卻步步精準。張一鳴 作爲“一把手”, 親自掛帥 AI 戰略,整合超千人的頂尖 AI 科學家軍團。 而 抖音、今日頭條等 旗下 產品 , 每天產生的海量視頻數據, 更 爲其多模態模型 提供了充分 的“養料”。

一個典型案例是 “豆包 AI 助手” 的迭代:初期只是簡單的聊天機器人,如今已能根據用戶輸入的文字生成短視頻腳本、自動剪輯視頻,甚至通過分析用戶表情推薦內容。這種 “流量 + AI” 的閉環,讓字節的模型訓練擁有天然優勢。此外 ,字節在視頻生成、實時 交互等 領域的技術突破, 也 在 一 步步 重新定義 和拓展 “內容創作”的邊界。

4、百度文心大模型:搜索巨頭的 AI涅槃

百度是國內最早佈局大模型的公司之一,文心大模型已經迭代到 ERNIE 4.0 版本。其核心優勢在於“搜索 + 大模型”的深度融合 。比如, 用戶搜索 “如何煮咖啡”,文心大模型不僅能給出步驟,還能生成對應的視頻教程、推薦咖啡豆購買鏈接。這種 “內容 + 服務” 的一體化能力,讓百度在 To C 場景中佔據先機。網盤、文庫、地圖等國民級應用,幾乎都用AI重新做了一遍,而且商業上的表現格外亮眼,是國內第一批找到PMF的AI產品。

此外,百度還在努力破圈,實現大模型的落地應用。比如, 在工業領域,百度與三一重工合作探索設備智能化維護。在政務場景中,百度依託文心大模型爲 某地 區打造 “政務雲腦”, 提升服務效率 等 。這家老牌大廠正持續發力,努力 爲自己 在A I時代扳回 一 城。

03 中國需要更多DeepSeek

除了以上四家大模型公司 ,國內AI 圈還有 一批極具潛力的“後浪”在奮力追趕,試圖在基礎模型或其核心能力上實現突破,成爲下一個“ DeepSeek ”。

1、智譜AI:開源+閉源,生態完整

背靠清華大學知識工程實驗室,智譜 AI 帶着濃濃的 “學院派” 基因。它的 GLM 系列模型在中文問答、代碼生成領域表現優異, 其所 堅持 的 “開源+ 閉源”雙輪驅動 策略, 更是捷報頻傳。

開源方面, 智譜 2025 年大手筆開源 多款模型,吸引全球開發者挖掘潛在問題、貢獻優化思 路,模型性能也因此 一路飆升; 閉源商業化 同樣 風生水起,2024 年中標 32 個 政府及企業項目,攬金 1.29 億元。在 金融、醫療、政務等 20 多個行業裡,智譜的模型都成了核心生產力工具。

智譜的 發展如同它的定位 ,2G/2B 業務齊頭並進,一邊紮根政府項目, 助力數字政務升級; 一 邊幫企業智能客服、智能辦公,全方位提升效率, 讓自己的生態更完整,發展 更穩健。

2、MiniMax:音頻、視頻,一騎絕塵

在多模態賽道尤其是音 視頻領域, MiniMax 絕對是 不容忽視的 存在。 其自 研 的語音大模型能夠生成媲美真人的、富有情感的語音,在社交、遊戲、教育等場景有巨大潛力。在視頻生成上 也同樣出色 ,輸入文字腳本,幾秒鐘就能渲染出特效 炫 酷、劇情緊湊的短視頻,極大降低成本。 MiniMax 推出的AI社交應用“星野”、AI助手“海螺AI ”等產品,也展現了其將技術快速產品化的能力。

此外, 創始人閆俊傑 曾是商湯科技副總裁,對技術和商業都有着極爲深刻理解。 在 當前 短 視頻、直播帶貨火爆全網,對音頻特效、視頻內容自動化生產需求井噴的市場環境下, 帶領 MiniMax 和各大短視頻平臺、音頻內容創作社區深度合作,爲創作者持續輸送 “彈藥”,在垂直賽道越跑越快 ,一騎絕塵 。

3、月之暗面:長文本、數學能力強

月之暗面專注長文本處理與數學推理,這堪稱 知識密集型場景的硬核需求。 比如,在學術研究領域 ,長篇文獻綜述撰寫,它能梳理海量文獻脈絡,精準提煉關鍵觀點; 在 金融風控領域 , 又能靠它 分析長篇財務報告、挖掘隱藏風險點,給出量化評估建議。

Kimi 在數學推理等領域也展現出不俗的實力 , 其推出的 k0-math 數學推理模型在多個基準測試中表現優異,並 在中考、高考、考研及 MATH 等基礎數學測試中的表現超越了 OpenAI 的 o1-mini 和 o1-preview 模型。

4、階躍星辰:多模態領域表現突出

階躍星辰 成立短短兩年,就推出 22 款自 研 基座模型,其中 16 款多模態模型,佔比超 7 成 ,被 稱爲 “多模態卷王” 。它堅持理解生成一體化路線,這種技術遠見,完美契合當下 AI 從多模態融合邁向一體化的大趨勢。 階躍的 多模態模型 不僅 在國內外權威榜單上頻頻奪冠, 更是和產業界展開了深度融合,比如 和 OPPO 手機合作 “一鍵問屏” 功能, 用戶長按手機 界面,就能智能檢索屏幕內容相關信息;和智元機器人攜手, 爲具身機器人 裝上 “智慧眼睛”,精準識別環境、靈活規劃行動路徑。

此外, 階躍星辰 的商業化之路也走得非常紮實,比如 茶百道接入它家 Step-1V 多模態理解大模型 ,實現智能巡檢、AIGC 營銷,門店運營效率 大幅提升, 也 讓 階躍 星辰 收穫了 更多 的 付費用戶 。

04 最終比拼的是商業化能力

從當年的“百模大戰”,到後來的 “ A I六小虎 ”,再到如今 的 “新基模五強” ,爲什麼短短兩三年的時間,就有那麼多 紅極一時的 A I企業,或出局或“ 泯 然衆人矣” ?一個極爲重要 原因 就 是: 有些企業 只懂燒錢做技術,不懂賺錢做商業。

如上文提到的, 大模型是資本密集型、人才密集型、數據密集型行業 。 但 僅僅有錢、有人、有數據,就能成功嗎?未必。商業的本質是創造價值並獲取價值。技術再先進,如果 不能轉化爲用戶願意買單的產品或服務,不能形成可持續的商業模式, 最終也只是曇花一現。這就像“必要條件”和“充分條件”的關係,錢、人、數據是必要條件,但成功的商業化纔是充分條件。

所以 我們 會 看到,無論是 OpenAI 與微軟的深度綁定,通過Azure 雲服務 和Copilot系列產品變現;還是國內的阿里、百度、字節,依託自身的 雲服務 和豐富應用場景推動大模型落地,都體現了“技術+場景+商業”的閉環邏輯。 而這也恰恰 暗合了 商業達爾文 主義:能活下來的一定是踩中 時代節奏 、滿足市場剛需、 又能實現商業模式 自洽的企業 ,而不會是技術浪漫主義者,或A I理想主義者 。

最後 ,中國或許 真的 不需要幾十上百家公司 , 都去 卷基礎 大模型 。 這既不經濟,也 不 高效。少數幾家巨頭在基礎模型層面持續投入,提供穩定、強大、且成本可控的“AI底座” 就足夠了。更多的創新和機會,應該在於應用層,在於如何利用 大模型,結合行業Know-how , 解決實際問題, 創造真正的商業價值。

來源 | 技術領導力(ID:jishulingdaoli)

作者 | Mr.K ; 編輯 | 蝦餃

內容僅代表作者獨立觀點,不代表早讀課立場