AI界又迎“諾曼底時刻”:2023的ChatGPT,2024的六小虎,2025的DeepSeek!
最近,網上流傳着這樣一個梗:"2022年ChatGPT將在未來取代很多人的工作;2023年ChatGPT將在未來取代很多人的工作;2024年ChatGPT將在未來取代很多人的工作;2025年DeepSeek取代了ChatGPT的工作。"
事實或許正像梗裡說的那樣,DeepSeek火爆出圈,在2025年的春節期間持續發酵,幾乎一夜之間就火遍全球、世人盡知。
這種場景,猶如回到了兩年前。
2023年春節期間,ChatGPT火爆出圈。它是美國AI公司OpenAI發佈的基於大語言模型GPT-3.5的AI聊天機器人程序。在上線初期,OpenAI沒有進行大規模的宣傳,卻在短短兩個月內,月活用戶突破1億,成爲史上用戶增長速度最快的消費級應用程序。《紐約時報》稱其爲"有史以來向公衆發佈的最佳人工智能聊天機器人";微軟聯合創始人比爾・蓋茨也公開表示,ChatGPT的誕生有着重大歷史意義,不亞於互聯網或個人電腦的誕生。
在國內,自2023年3月份GPT-4上線後,國內科技企業紛紛跑步入場,開啓"百模大戰":百度"文心一言"、阿里巴巴"通義千問"、華爲"盤古"、360"智腦"等大模型先後登場。除通用大模型外,不少企業也推出了深耕行業、具有專業能力的垂直大模型,例如攜程的旅遊行業大模型"攜程問道",本站有道發佈基於教育的大模型"子曰"等;此外,清華、復旦、中科院等高校與科研院所也在大模型領域深度佈局。
2024年一開局,"大模型六小虎"(智譜、Minimax、月之暗面、零一萬物、階躍星辰、百川智能)順勢而生,它們以各自的技術特點和優勢,尤其是暴漲的估值,一度成爲國內科技圈及商業界的"現象級創業天團",持久"霸屏"。
然而,在天使投資人曾良看來,在2024年被熱議的"Kimi們"都只能稱之爲"小火花","與ChatGPT和DeepSeek相比,還不在一個量級上。"他對未來圖靈表示,"六小虎"在技術實力、市場影響力等方面,與頭部的AI產品仍存在差距。
"現象級公司":DeepSeek
有業內人士分析指出,DeepSeek的爆火與2023年ChatGPT的走紅有着諸多相似之處。
二者均在春節長假期間於海內外迅速發酵,引發全球關注。2023年,ChatGPT一經推出便刺激中美市場AI軟硬件方向全面爆發;而在2025年,DeepSeek的崛起則導致美股硬件端大跌,A股市場英偉達產業鏈受挫,不過,與此同時,中美市場的AI應用及軟件方向卻迎來大幅上漲,呈現出此消彼長的獨特態勢。
在資本層面,ChatGPT與DeepSeek都引發了各路資金的共振。無論是機構投資者、遊資,還是廣大散戶,都積極參與到AI板塊的投資中。近期,金山辦公、三六零、用友網絡、金蝶、海光信息、中科曙光、科大訊飛、浪潮信息等中大市值股票紛紛大漲。
並且,在市場疲弱之際,ChatGPT、DeepSeek都能挺身而出。2023年2月-7月市場調整時,AI方向成爲穩定市場、引領市場的關鍵力量;如今,在當前市場調整階段,端側AI和AI應用再次因DeepSeek的出現而爆發。
DeepSeek成立於2023年7月17日,自成立以來,便專注於先進大語言模型及相關技術的開發,在硅谷,它很早就被稱作"來自東方的神秘力量"。2024年底,DeepSeek發佈新一代大語言模型V3,而2025年1月20日,DeepSeek發佈其最新開源模型R1,再次引發全球人工智能領域關注。R1模型在技術上實現了重要突破——用純深度學習的方法讓AI自發涌現出推理能力。
產品發佈後,DeepSeek在全球範圍內迅速走紅。在中國區和美國區蘋果AppStore免費榜中,DeepSeek均位列首位,超越了包括ChatGPT在內的多個知名AI產品。其不僅能夠理解並準確回答各類問題,還能輔助寫代碼、整理資料以及解決複雜的數學問題,被網友親切地稱爲"全能型AI助手"。與OpenAI開發的ChatGPT相比,DeepSeek率先實現了媲美Open AI-o1模型的效果,還將推理模型的成本大幅降低。新模型DeepSeek-R1僅以十分之一的成本就達到了GPT-o1級別的表現,設計成本更是不到600萬美元,海內外AI圈稱之爲"小力出奇跡"。
目前,DeepSeek已獲得國內外雲巨頭的大力支持。阿里雲、百度智能雲、華爲雲、騰訊雲國內四大雲巨頭都已正式支持DeepSeek,此前,海外的亞馬遜AWS、微軟Azure等雲巨頭也已官宣支持。不少大廠員工在社交媒體上表示,春節假期都在爲DeepSeek公司加班。不僅如此,英偉達市值蒸發創紀錄、DeepSeek卡頓、榜單第一……與DeepSeek直接間接相關的新聞,在春節期間不斷刷新。
中信建投稱,DeepSeek激活創新競爭,AI應用迎來"安卓時刻";華西證券將DeepSeek的出現,視爲國產AI應用的"諾曼底時刻"。
Deepseek推動AI實現"平民化"
如果說2023年爆火的ChatGPT是讓大家普遍認識到了AI的可用性,那麼2025爆火的Deepseek則有望推動AI實現"平民化"。
業內人士稱,DeepSeek攪動了全球AI的"一池春水",其顛覆性在於實現AI平權,並且重估資產價值。
DeepSeek基於開源AI系統,爲更多開發者創造了開發實用AI應用場景的機會,讓AI能夠真正走進普通人的生活。AI開源初創公司Hug-gingFace聯合創始人、首席科學家ThomasWolf在日前的公開活動上談論到DeepSeek時表示,人工智能的下一步將是"應用"。"很多模型已經開源並且向用戶免費提供,"他說,"下一步將是如何在這些模型之上建立應用,讓模型在應用層面變得有用,從而能完成現實中的任務,讓每個人能在生活中受益。"他還表示,很多時候人們並不需要一個能夠解決最前沿數學問題的大模型。"大部分的現實場景應用不需要那麼高級別的智商,這些應用是很容易建立起來的。"
DeepSeek採用無人爲干預的強化學習方式,這是其獨特核心。以訓練DeepSeek-R1-Zero基礎模型爲例,訓練中模型能自行摸索出類似人類解題的方法,自行涌現推理能力,和其他模型有着本質區別,此前只有Open AI有推理模型且對其推理方式保密,而DeepSeek不但探索出此路徑,還公開了推理模型的秘密。在訓練成本上,DeepSeek優勢極大,其R1的預訓練費用僅557.6萬美元,使用約2000個英偉達專用芯片就完成訓練;相比之下,Open AI訓練ChatGPT-4o花費高達7800萬美元甚至1億美元,且需要上萬張GPU芯片。科研人才投入方面,DeepSeek團隊僅約140研發人員,Open AI團隊則有1200名研究人員。同時,DeepSeek API定價也極具性價比,收費大約是Open AIo1運行成本的三十分之一,被稱爲AI界的"拼多多"。
DeepSeek還支持模型蒸餾,能將推理能力遷移到更小型的模型中,經R1蒸餾的小模型推理能力顯著提升。並且,DeepSeek基於前代MLA+MOE架構訓練,降低訓練成本,遵循MIT License開源協議,允許用戶自由使用、修改和商用,還開源了R1-Zero和多個蒸餾後的小模型。
清華大學長聘副教授劉知遠日前在參與由中國計算機學會青年計算機科技論壇策劃的直播活動時表示,"DeepSeekR1的開源,讓全球的人能夠意識到深度思考的能力。這相當於讓整個人工智能領域再次迎來了類似於2023年初ChatGPT的時刻,讓每個人感受到大模型的能力又往前邁進了一大步。"劉認爲,DeepSeekV3展示瞭如何用十分之一甚至更少的成本完成達到GPT-4和GPT-4o水平的能力,此外DeepSeekR1的出圈也證明了OpenAI犯了"傲慢之罪"——它不開源,不公開技術細節,且定價過高。
DeepSeek影響投資風向?
DeepSeek的崛起,還顯著影響了AI投資風向。
2024年初,朱嘯虎在談及中國大模型創業公司時曾表示:"我們一看就知道,這個肯定沒戲""我們一開始就說了,我就不看好大模型!"他認爲大模型創業面臨諸多困境,比如融資難、商業化路徑不明等問題。在當時,他秉持着現實主義的投資理念,認爲創業者應更多關注商業模式的落地與商業化的可能性,而不是盲目投入大模型的研發。
到了2024年底,他對於AGI的態度依舊冷淡,認爲在當時的AI架構上根本不可能實現AGI,直言"今天還忽悠AGI的人都是有自己另外想法的"。在他看來,AGI更多是一種遙遠的理想,而非當下能夠實現的現實。
事實上,月之暗面(kimi)從高光時刻的跌落,也與朱嘯虎不無關係。(參見未來圖靈文章:月之暗面"交惡"投資人揭秘:成敗張予彤?)
然而,2025年春節期間,DeepSeek的異軍突起徹底改變了朱嘯虎的看法。他在接受騰訊科技的訪談時,毫不吝嗇對DeepSeek的讚美之詞,用"真的讓我大開眼界""非常驚豔""非常驚訝""很吃驚""哇!"等話語來表達內心的震撼。他反覆強調DeepSeek與自己交互時的體驗,用"太優美了""非常有深度"來評價,這兩個詞他總共強調了16遍。
朱嘯虎甚至對騰訊科技表示,DeepSeek快讓他相信AGI了。他認爲DeepSeek證明了一條實現AGI的可能路徑,而且實現成本相對較低。
朱嘯虎態度的轉變,在一定程度上反映了AI投資風向的轉變。此前,投資者對於大模型創業公司普遍持謹慎態度,關注重點在於商業模式的可行性和商業化的前景。
英諾天使基金合夥人、北京市前沿國際人工智能研究院理事長王晟曾表示,"2023年沒投大模型的投資人很焦慮,而2024年投了大模型的投資人更焦慮。"他認爲,大模型企業耗資大,落地場景和賺錢能力未被證明,AI能力有提升空間,導致後續融資有較大不確定性。
而一位匿名投資人曾在2024年對科創板日報預測稱,2025年大模型及相關企業融資難度或較大。另外能接盤的資本也非常有限,"大模型企業可能更多尋求中東等國外資本,但實際融資金額和宣傳可能存在差異,比如,國資可能會有相應的一些產業落地要求等,如果達不到後期打款或許會設限。"
此次DeepSeek的成功,是否會讓投資者開始重新審視對大模型創業公司的投資策略?
DeepSeek衝擊下,"六小虎"如何自處?
據非凡產研數據顯示,截至1月31日,DeepSeek移動端DAU(日活躍用戶)已突破2570萬,相當於同日ChatGPT移動端日活數量的50.23%。在PC端,DeepSeek表現同樣強勁,1月28日,其官網(chat.deepseek.com)單日活躍用戶飆升至2477萬,達到ChatGPT官網(chatgpt.com)同期日活的33.26%。
自2025年1月11日至1月31日,DeepSeek全平臺(WEB端+APP端)日活躍用戶數從124萬上漲到峰值的4541萬,累計增幅高達36.6倍,並於1月24日超過月之暗面旗下AI應用Kimi,1月27日超過字節跳動旗下AI應用豆包,成爲全平臺日活排名全球第二大AI應用。
DeepSeek飛漲的速度讓人望塵莫及,自2025年1月11日至1月31日,DeepSeek移動端下載量迅速飆升至峰值的1104萬,刷新全球AI應用單日下載量紀錄,當月累計下載量4592萬次,而同期ChatGPT移動端累計下載量爲3489萬。
2月6日,Google發佈Gemini 2.0,各家都在報道劍指的就是DeepSeek,這在之前是不可想象的。許多業內人士表示,這直接將DeepSeek拉到了跟OpenAI、Gemini齊平的水平線上。他們認爲,誇張點說,DeepSeek甚至可能會終結國內的"百模大戰"。
有業內人士對未來圖靈表示,"大模型六小虎"的出現是由於在ChatGPT衝擊下,中國市場衍生的"中國大模型",而如今DeepSeek的崛起,會讓這些原有的公司越來越難受,甚至需轉型。
2024年"大模型六小虎"還風光無限。據此前公開資料統計,"六小虎"2024年均獲得了億元級融資,大模型項目在一級市場吸金超過200億元。其中,智譜、月之暗面、百川智能估值已超200億元。"吸金"能力最強的是2024年底深陷仲裁風波的月之暗面。2024年初,阿里投資月之暗面近8億美元,隨後的8月,月之暗面再度收穫大額融資,躋身估值超200億元的國產大模型獨角獸之列。如今,舊秩序被打破,新規則尚未建立。Gartner分析師Chirag Dekate認爲:"DeepSeek並未戳破AI泡沫,反而爲其注入新增長動力。"
隨着DeepSeek熱度飆升,聯想、釘釘等科技巨頭推出基於其大模型的一體機解決方案,華爲也宣佈全面支持DeepSeek大模型本地部署。財信證券稱,DeepSeek或許正在重塑AI產業格局 ,中國AI科技股未來可期。
或許,這也正是所有人樂見的。最近,零一萬物首席執行官、創新工場董事長李開復博士在接受《人民日報》英文客戶端專訪時,就如此表示:"兩年前ChatGPT問世時,中國可能落後了七年左右的時間。但在過去兩年中,中國已經在快速學習並開發出了很多非常優質的大語言模型,模型性能非常接近美國頂尖模型,也許還比不上最好的模型,但已經相當接近。與此同時,中國模型的效率要高得多。"