DeepSeek是中國AI市場的“鮎魚”?

2025年春節前後,DeepSeek憑藉開源多模態模型Janus-Pro與DeepSeek-R1推理模型的發佈,以"低成本、高性能"的顛覆性優勢橫掃全球市場。其開源策略不僅讓開發者以API調用成本僅爲GPT-4的1/30的極低成本調用頂尖模型,更打破了此前行業內對於"算力決定效用"的認知,甚至導致英偉達單日市值蒸發4.3萬億元人民幣(約合6000億美元)。

DeepSeek爆紅之後,迅速迎來各行各業的"接入潮"。其AI助手在140個國家和地區的應用商店下載量登頂。隨着越來越多大模型和小模型的接入,行業內也由此引發了不少爭論,其中關於技術替代性和生態主導權的討論比較激烈。

所謂"技術替代性",是指DeepSeek通過MoE架構(混合專家模型)與FP8混合精度訓練技術,將訓練成本壓縮至557.6萬美元,僅爲GPT-4o的1/18,卻實現了與GPT-4o和Claude-3.5相媲美的性能。這種"算法創新+有限算力"的路徑,是否意味着傳統"算力堆砌"範式的終結?如果算力不再是門檻,模型訓練的准入成本將大幅下降,中小企業有望基於開源模型快速開發行業應用,極大推動AI的普及。但對依賴高算力的雲服務商而言,則可能意味着被邊緣化的風險。

而"生態主導權"之爭,則聚焦於開源代碼的復刻與再開發。DeepSeek的開源成果甚至被微軟、亞馬遜等美國科技巨頭納入產品體系。閉源廠商擔憂"開源即統治"的策略可能重構行業權力結構,形成類似Android的生態霸權,從而進一步壓縮其商業利潤空間。

因此,隨着企業紛紛接入DeepSeek,其引發的,不僅是技術替代路徑的再思考,更是生態主導權爭奪的全面博弈,值得深入分析。

廠商接入DeepSeek的路徑與模式

DeepSeek的開源策略如同一塊磁石,吸引了從雲服務商到垂直軟件廠商,再到獨立大模型公司的廣泛接入。不同類型的廠商基於自身資源與戰略需求,探索出差異化的融合路徑。

數據猿對各類企業接入DeepSeek的路徑和模式進行梳理和總結,從雲廠商、垂直軟件廠商和獨立大模型廠商三類企業展開分析。

雲服務商接入DeepSeek主要是進行技術整合和業務協同,作爲算力基礎設施的提供者,雲廠商率先將DeepSeek融入自身生態,形成了"底層算力+模型服務"的雙引擎模式。在接入的方式上,雲廠商的接入方式有三種:

1.API直連:通過雲平臺直接調用DeepSeek模型。例如騰訊雲HAI平臺提供DeepSeek- R1等模型的服務,允許開發者一鍵創建API接口,直接調用DeepSeek的模型服務滿足其業務需求。

2.私有化部署:這種方式主要針對安全性要求比較高的行業或企業,比如金融、政務等行業,雲服務廠商一般會提供本地化部署方案。例如:中國電信天翼雲憑藉以"息壤"爲核心的一體化智算服務體系和能力,實現昇騰芯片+MindSpore框架+DeepSeek模型全棧國產化適配,推理性能比肩國際高端GPU,從昇騰硬件、推理引擎到模型服務,實現技術鏈路100%國產化。

3.混合架構:有自研模型的雲廠商也會採用這種融合的方式實現業務的協同,例如:阿里雲PAI平臺支持DeepSeek-V3、R1及蒸餾模型的一鍵部署,結合vLLM加速框架實現推理吞吐量的提升。

無論是哪種接入方式,DeepSeek的融入確實給雲廠商帶來了業務的協同發展,實現了算力資源的高效變現。例如:華爲雲通過昇騰910B集羣優化DeepSeek推理效率,推出"ModelEngine"本地化部署工具,幫助車企大幅壓縮模型加載時間 。

如果說雲服務廠商的接入是技術整合和業務協同,那垂直軟件廠商的接入則是圍繞功能增強和成本優化。軟件廠商將DeepSeek看作"智能引擎",通過嵌入現有產品中,實現產品AI功能和服務的快速升級。軟件廠商的接入模式也主要有三種:

1.輕量級API調用:通過簡單接口調用模型能力,例如釘釘集成DeepSeek-R1的AI會議紀要功能,實現語音轉文字、任務自動生成和多語言實時翻譯等功能。

2.私有化定製開發:針對企業需求定製模型。例如,冪律智能基於DeepSeek-R1開發的合同審查系統,實現條款風險識別準確率的大幅提高。

3.端側輕量化部署:在終端設備嵌入小型化模型。例如,比亞迪DiPilot 5.0引入DeepSeek-R1模型後,提升了雲端和車端的AI推理能力。

對於垂直軟件廠商而言,接入DeepSeek的主要目的就是降本增效,一切都是圍繞着服務和成本出發。同時,也在一定程度上實現了功能差異化競爭。而對於獨立大模型廠商而言,DeepSeek的爆火給他們帶來了較大沖擊,從目前獨立模型廠商的動作看,兩極分化的狀況非常明顯。開源的大模型廠商積極擁抱合作,而閉源的大模型廠商則開始出現賽道分化。

開源陣營與DeepSeek的合作主要體現在兩個方面,一是在合作模式上,不少廠商基於DeepSeek微調自家的行業模型,從而加深了行業的深耕力度。例如:智譜AI推出"GLM-DeepSeek"金融模型,針對銀行風控場景優化,某城商行使用後壞賬識別準確率大幅提升。二是貢獻代碼反哺開源社區。例如:MiniMax開源的新一代MoE多模態訓練框架,採用線性注意力機制替代傳統Transformer架構,支持高達400萬token的上下文處理能力,顯著提升長文本場景的計算效率。而DeepSeek的MLA架構優化了資源受限場景的推理效率,雙方技術路線形成互補,爲開發者提供從長文本解析到高效推理的全棧解決方案。這種技術的合作和共享,吸引了越來越多的開發者參與生態建設,促進了行業的快速發展。

與開源陣營不同,閉源陣營面臨的挑戰更大,其中最大的挑戰就是"三不夠",即:錢不夠、卡不夠、數據不夠。在這種情況下,"AI六小虎"已經開始分化賽道,當然這並非完全因爲DeepSeek的影響,更多的是資源不足下,企業不得不轉而求其次。例如:百川智能再收縮和裁撤金融業務、all in醫療;零一萬物放棄了原定的萬億參數 Yi-X-Large 模型訓練計劃,轉而訓練更輕量化、更具商業落地前景的 MoE(混合專家)模型 Yi-Lightning。

不得不說,在DeepSeek的影響下,獨立大模型廠商的分化正在重塑產業格局,開源陣營通過生態合作快速擴張,而閉源陣營則被迫在細分領域尋找機會和生存空間。

DeepSeek重塑產業格局

從目前衆多廠商接入DeepSeek的方式和對公司業務產生的影響來看,DeepSeek的開源策略和技術突破,確實改變了企業的技術選擇邏輯,同時也影響了企業的業務和戰略選擇。但如果站在更高的維度觀察和思考,DeepSeek也進一步引發產業鏈上下游的連鎖反應,其影響已經超越了單純的技術競爭,正逐漸演變爲商業生態的重構。

首先,算法革新和開源模型降低了進入門檻,使得整個供應鏈下游的機會成本降低,加快了場景應用的落地。過去十年,大模型的發展依賴"算力堆砌+數據膨脹"的路徑,以GPT-4爲例,其訓練成本約1億美元。這種模式導致AI行業陷入"算力軍備競賽",中小企業根本無力參與。然而DeepSeek的出現帶來了"算法革命"和工程優化,前者通過MoE架構(混合專家模型)動態激活8/256個專家模塊,使得硬件利用率提升4.8倍,後者通過MoE架構和FP8混合精度技術,訓練成本壓縮至557.6萬美元(僅爲GPT-4的1/18),並實現昇騰910B芯片推理效率的大幅提升。

這意味着AI的入局門檻大幅降低,算力效率大幅提高,各行各業的中小企業也將會積極參與,由此導致行業下游的企業不再被動的觀望,而是可以基於開源模型快速開發應用,享受技術革新帶來的好處。比如,山東壽光某農場,使用DeepSeek開發的智能灌溉系統,在節水40%的情況下,使種植的番茄增產18%。類似的行業應用落地場景在不斷增加,並向更多的領域擴散。

其次,市場競爭也面臨重構,大廠開始分化,創業公司"斷臂求生"。對於雲廠商而言,他們的發展方式出現"雙軌制",也就是"兩條腿"走路:一是將DeepSeek與自研大模型結合,用戶可以自由選擇底層模型,比如騰訊的元寶,用戶在使用時,可以選擇DeepSeek或混元模型;二是將DeepSeek與當前業務協同起來,幫助客戶實現降本增效。

對於垂直軟件廠商而言,儘管他們沒有自研大模型,但可以在現有的產品和服務中增加DeepSeek的功能,從而進一步實現與用戶的深度綁定,比如用友網絡在ERP系統中基於DeepSeek-R1開發的合同審查系統,實現合同條款自動解析與風險預警。

最難的就是AI行業中的創業公司,尤其是閉源廠商,在原有的"三不夠"挑戰沒有被完全解決的情況下,開源的Deep Seek和抱團取暖的開源廠商們,已經將其逼近"懸崖邊",不少閉源廠商不得不另闢蹊徑,尋找適合自己的優勢領域和場景。

由此可見,無論是大公司還是中小企業,無論是雲廠商還是軟件廠商,對於DeepSeek的積極接入總算是沒有讓自己在激烈的競爭中落後。然而,對於大模型廠商而言,這場可能重塑產業格局的"風暴"可能纔剛剛開始,未來大模型廠商的生存邏輯是什麼?可能選擇的方向在哪裡呢?

大模型廠商的"十字路口"

回首2023年初,當ChatGPT問世時,全球震驚,人工智能的熱潮迅速席捲全球。很快,大模型也在國內熱鬧起來,一時間各大科技公司紛紛宣佈已經投入研發大模型,並紛紛在最短的時間內發佈相關產品,引發了"百模大戰"。然而,隨着DeepSeek的問世,大模型企業也或多或少的受到了衝擊,對於大模型企業未來發展和轉型的討論也越來越多。

第一個被熱議的話題就是有了DeepSeek之後,底層模型的競爭是否還有意義?認爲仍有必要的加大底層模型研發投入的人認爲,首先,不同行業對底層模型的需求存在差異,而底層模型的競爭可以推動技術適配細分市場;其次,DeepSeek的成功依賴於算法優化與硬件效率的協同,但其他廠商在異構計算、邊緣設備推理等領域仍有創新空間,例如,AMD通過集成DeepSeek-V3模型優化Instinct MI300X GPU推理性能,結合SGLang框架實現吞吐量提升,說明底層模型的競爭可驅動硬件生態多樣化;第三,DeepSeek的開源策略雖降低了應用門檻,但單一技術路徑可能抑制創新活力,例如,Meta被迫開源線性注意力框架支持400萬token長文本處理,OpenAI考慮部分開源應對競爭,印證行業探索多技術路線的壓力,這種壓力促使行業探索更多技術路線(如多模態、跨平臺整合),避免形成技術霸權。

而反對底層模型競爭的人也有三個方面的觀點,首先,DeepSeek通過"低成本推理+開源生態"重構行業標準,其模型性能和成本優勢形成護城河。中小廠商若重複投入底層研發,可能因資源不足陷入"無效內卷";其次,DeepSeek的開源模式使開發者可基於其框架快速構建應用,無需從零開發底層模型。例如,騰訊元寶、百度文心等通過接入DeepSeek能力實現產品升級,說明行業重心已從底層競爭轉向應用層創新;第三,在DeepSeek的衝擊下,頭部廠商轉向商業化落地,中小廠商聚焦細分場景。這種分工模式更符合資源配置效率,底層模型的集中化可能成爲常態(類似安卓系統與手機廠商的關係)。

數據猿認爲,這個問題的爭辯目前很難有定論,底層模型競爭的意義需分階段看待:短期內,DeepSeek的領先地位可能削弱重複性競爭;但長期來看,技術突破仍需多元探索。行業的未來或將呈現"一超多強"格局,通用模型由頭部主導,垂直領域則由專業化模型補充。

第二個被關注較多的話題是大模型廠商的轉型路徑選擇。從目前大模型廠商的動作分析,轉型的方向主要有三個:一是To B服務升級,從模型銷售轉向"模型+行業Know-how"解決方案;二是垂直領域深耕,聚焦長尾場景構建壁壘;三是通過開源社區運營,構建生態影響力和長尾創新。

To B服務升級:大模型廠商通過將通用能力與垂直行業知識結合,解決企業數據隱私、場景適配等核心問題,例如:阿里雲與一汽合作,通過通義千問+DeepSeek混合架構,將車型開發週期大幅壓縮。

垂直領域深耕:大模型廠商可以針對某些專業性強、數據敏感性要求高的行業,打造具備行業專屬知識庫的輕量化垂直模型,例如:醫療大模型融合醫學文獻、臨牀數據和專家經驗,解決診斷與藥物研發的"最後一公里"問題。這些垂直領域的大模型有兩個競爭壁壘,一是數據壁壘,二是場景壁壘,雙重壁壘爲大模型廠商的市場競爭和商業化帶來足夠的保障。

開源社區運營:開源策略是優勢是能夠降低企業使用門卡,同時又能通過社區貢獻反哺技術迭代,有利於行業的快速發展,但是它的難題在於商業化面臨挑戰。開源的大模型廠商需要平衡開源生態與核心商業利益,目前,OpenAI雖未完全開源GPT-4,但通過API服務與開發者形成共生關係,而DeepSeek則採用MIT協議開源,允許商業用途並推動下游應用創新。

當前大模型廠商的轉型呈現三大特徵:技術深度垂直化(從通用到行業專用)、商業模式分層化(基礎服務免費+增值服務收費)、生態協作開放化(開源與產業鏈協同)。預計未來大模型的競爭將圍繞着技術(多模態能力提升與邊緣計算優化)、商業(探索MaaS與AI Agent集成)、政策(數據合規與開源治理體系完善)展開,而廠商需要根據自身資源稟賦選擇路徑,找到公司的生態位。例如,頭部企業可佈局全棧能力(如百度文心一體機),初創公司則需聚焦細分場景(如巖芯數智深耕金融AI)。

"後DeepSeek時代"的趨勢

目前來看,DeepSeek的出現和衆多廠商的接入,並非短期的熱點現象,行業的發展趨勢可能會因此而發生轉變,其中,大模型廠商的轉型發展也是"後Deep Seek時代"的短期趨勢之一。數據猿認爲,中國的大模型產業,正在從之前的"規模擴張"轉向"價值深挖"。

短期來看,兩個趨勢非常明顯,一是大模型行業的市場整合在加速,缺乏差異化能力的中小廠商被併購或退出,頭部效應加劇。DeepSeek開源模型帶來的技術普惠化顯著降低了行業門檻,但也加劇了市場競爭的"馬太效應"。當前,中國大模型市場已形成"頭部企業主導+細分賽道差異化競爭"的格局。頭部企業如阿里雲、騰訊雲憑藉算力資源、行業數據積累和生態整合能力,加速搶佔市場份額;而中小廠商若無法在垂直場景中建立技術壁壘(如醫療領域的診斷精度、製造業的實時質檢能力),則面臨被併購或退出的風險。例如,智譜AI等"六小虎"企業已通過聚焦政務、金融等場景的定製化服務穩固地位,而部分通用模型初創公司因同質化嚴重被頭部企業整合。

二是政策引導強化,數據安全與國產化要求推動DeepSeek在關鍵行業的深度滲透。在國產化替代與數據主權強監管的雙重驅動下,DeepSeek的"開源+國產芯片適配"模式成爲關鍵行業首選。例如,華爲昇騰等國產芯片廠商通過與DeepSeek的深度優化,完成適配。政策層面,國家超算互聯網平臺已上線DeepSeek-R1、V3、Coder等系列模型,要求能源、交通等關鍵基礎設施優先採用國產化大模型解決方案。同時,數據分類分級與隱私計算技術的強制應用,進一步鞏固了具備本地化部署能力的頭部廠商優勢。

站在3-5年的長期維度看,大模型的技術融合和全球化競爭仍然值得關注。技術融合方面,未來大模型將突破單一模態侷限,向"多模態+邊緣計算+可信機制"的融合架構演進。例如,DeepSeek R1模型已通過強化學習框架實現與物聯網設備的協同推理,在智能製造場景中可實時分析生產線數據並動態調整參數。區塊鏈技術的引入則解決了數據溯源與模型可信問題,如政務領域的合同審覈系統通過鏈上存證確保決策透明。此外,類腦計算與神經符號系統的結合將推動大模型從"感知智能"向"因果推理"躍遷,在生物醫藥、材料研發等科學領域開闢新場景。

在全球化競爭方面,DeepSeek開源生態或成中國AI技術輸出的核心載體,挑戰Meta、OpenAI主導地位。目前,DeepSeek的開源策略正在重構全球AI技術生態。其MIT協議開源框架已吸引幾十個國家開發者參與貢獻,形成"基礎模型開源-垂直插件商業化"的生態閉環。例如,東南亞金融科技公司通過微調DeepSeek模型快速開發本地化風控系統,而歐美企業則利用其多語言能力降低跨國服務成本。這一模式直接衝擊OpenAI的API訂閱制與Meta的封閉生態,成爲發展中國家AI技術自主化的重要依託。

"後DeepSeek時代"的中國大模型產業,正從"規模擴張"轉向"價值深挖"。短期內的市場整合與政策合規化將爲行業奠定穩健基礎,而長期的技術融合與全球化生態競爭,則考驗着中國能否將工程化優勢轉化爲基礎理論突破。未來的AI競爭,不僅是算力與算法的比拼,更是開放協作與治理智慧的較量。