連夜研究,美股震盪,DeepSeek到底幹了什麼?

出品 | 本站科技態度欄目

作者 | 袁 寧

編輯 | 丁廣勝

DeepSeek給全世界人民,拜!年!了!

當DeepSeek從登頂中美應用商店免費榜,蔓延到成爲X、微博、小紅書的熱門話題,這場關於AI的狂歡也逐漸從技術範疇,走到了國運敘事。網友紛紛戲稱“建議連夜安排DeepSeek上春晚”。

春晚可能是趕不上彩排了,但這個年無疑難忘今宵。

(黑神話悟空製作人馮驥表示DeepSeek爲國運級別的科技成果)

事情從DeepSeek發佈新模型起,經過中美再次對賬,美國芯片封鎖好像不僅沒起到作用,反而激發了中國的創新?

一時間,各大主流媒體開始跟進,鋪天蓋地的報道下,持續看漲的英偉達股價大跌。

一衆大佬開始現身評價:特朗普表示DeepSeek給美國人工智能產業敲響了警鐘,ScaleAI創始人則暗戳戳表示中國人太努力,meta更是連夜成立四個專項小組研究其技術原理……

(《華爾街日報》:硅谷對中國製造的人工智能模型讚不絕口)

(《紐約時報》:DeepSeek是如何顛覆人工智能的)

(《時代雜誌》:DeepSeek引發股市混亂)

DeepSeek是什麼?爲什麼是它讓硅谷科技大佬集體破防?它又憑什麼造成了美股的震盪?你需要知道這些:

一、DeepSeek是什麼?

簡單來說,DeepSeek是一家中國的人工智能研究公司。旗下產品爲DeepSeek,可以在PC端和移動端使用。

首先,區別於硅谷AI企業依賴明星科學家的模式,DeepSeek核心團隊不到150人,沒有“明星”,也沒有“海歸”,人才構成完全本土。

創始人樑文鋒,80後,本碩均畢業於浙江大學。他曾透露,DeepSeek員工都是一些Top高校的應屆畢業生、沒畢業的博四、博五實習生,還有一些畢業才幾年的年輕人。此前,雷軍以千萬年薪招攬的95後“天才AI少女”羅福莉,就曾是DeepSeek的團隊成員。

此外,背靠量化私募公司幻方量化,DeepSeek至今沒有融資,完全靠自有資金運行。同時,它也是國內除大廠外,唯一擁有萬張A100芯片的公司。

( 2019年,樑文鋒在金牛獎頒獎儀式上,發表主題演講《一名程序員眼裡中國量化投資的未來》,當時幻方管理的資金規模就已破百億。)

二、AI界的“拼多多”,讓硅谷連夜查賬

宣稱能力可以對標GPT系列的模型並不少,爲什麼偏偏是DeepSeek讓硅谷AI圈集體大破防?

核心在於其極致低價的模型成本。

據介紹,對標GPT-4o的模型DeepSeek-V3,僅使用了2000塊英偉達芯片,訓練成本不到558萬美元,是同類模型的1/10。

要知道,OpenAI給特朗普畫的”星際大餅“可是價值5000萬美元。

Meta內部員工更是吐槽:“我們一個高管的年薪就夠訓練整個DeepSeek模型了,而這樣的高管我們有幾十個,公司怎麼向股東交代?“

其實,早在這次產生爆炸影響力之前,DeepSeek就已經憑藉其極致性價比,在去年5月出圈。獲得“AI界拼多多”稱號的同時,也帶動國內大廠打起了大模型價格戰。

但值得注意的是,區別於賠錢換流量的模式,DeepSeek在低價的同時仍然保持盈利。

樑文鋒曾介紹:我們只是按照自己的步調來做事,然後覈算成本定價。我們的原則是不貼錢,也不賺取暴利。這個價格也是在成本之上稍微有點利潤。

三、算力神話破滅?華爾街估值地震

而DeepSeek能夠保持低成本的原因,則在於其架構創新。

其首創MLA(多頭潛在注意力機制)與DeepSeekMoE架構,將顯存佔用降至傳統模型的5%-13%,並通過強化學習實現“無監督推理突破”——模型可自主反思糾錯,甚至展示數萬字思維鏈。

換句話說,僅用很少的AI芯片,通過算力效率提高,模型也能實現同樣的智能。打破AI產業對芯片依賴迷信的同時,也無疑給那些認爲僅靠鉅額資金就能遏制競爭的巨頭們,當頭一棒。

正因如此,DeepSeek-R1發佈次日,英偉達、博通股價分別暴跌16.9%和17.4%,微軟、谷歌跟跌,歐洲ASML、西門子能源跌幅超7%。

四、挑戰OpenAI霸權,用開放擊穿閉源護城河

此外,DeepSeek更是將代碼、訓練方法、論文全部公開,並在MIT協議下允許商業應用。

在”X“上我們已經可以看到伯克利、港科大等學生已用幾十美元成功復現模型,被英偉達科學家稱爲“非美國公司踐行OpenAI初心”。

(伯克利博士用DeepSeek復現模型能力)

要知道,OpenAI的API定價幾乎爲DeepSeek的30倍,而DeepSeek應用更是當前唯一支持免費聯網與深度思考的模型。試問什麼會比免費更香?

——DeepSeek的開源生態直接動搖了硅谷“閉源壟斷——高額訂閱”的盈利邏輯。正如深度學習之父楊立昆所言:“這不是中美之爭,而是開源對閉源的超越”。

以上就是,DeepSeek此次引起巨大反響的原因。

One More Thing

更令人驚喜的是,更多人看到了DeepSeek具備的“本土靈魂”。藉着年味,小紅書上的用戶已經開始嘗試用DeepSeek寫詩,寫春聯。

(Midjourney創始人使用DeepSeek之後的評價)

而DeepSeek能夠帶來的驚喜顯然不止於此,就在今天除夕,DeepSeek再次推出新模型。

辭舊迎新,2025年的AI江湖,好戲剛剛開場。期待中國科技早日從“追趕敘事”走向“定義敘事”。