連夜研究,美股震盪,DeepSeek到底幹了什麼?
出品 | 本站科技態度欄目
作者 | 袁 寧
編輯 | 丁廣勝
DeepSeek給全世界人民,拜!年!了!
當DeepSeek從登頂中美應用商店免費榜,蔓延到成爲X、微博、小紅書的熱門話題,這場關於AI的狂歡也逐漸從技術範疇,走到了國運敘事。網友紛紛戲稱“建議連夜安排DeepSeek上春晚”。
春晚可能是趕不上彩排了,但這個年無疑難忘今宵。
(黑神話悟空製作人馮驥表示DeepSeek爲國運級別的科技成果)
事情從DeepSeek發佈新模型起,經過中美再次對賬,美國芯片封鎖好像不僅沒起到作用,反而激發了中國的創新?
一時間,各大主流媒體開始跟進,鋪天蓋地的報道下,持續看漲的英偉達股價大跌。
一衆大佬開始現身評價:特朗普表示DeepSeek給美國人工智能產業敲響了警鐘,ScaleAI創始人則暗戳戳表示中國人太努力,meta更是連夜成立四個專項小組研究其技術原理……
(《華爾街日報》:硅谷對中國製造的人工智能模型讚不絕口)
(《紐約時報》:DeepSeek是如何顛覆人工智能的)
(《時代雜誌》:DeepSeek引發股市混亂)
DeepSeek是什麼?爲什麼是它讓硅谷科技大佬集體破防?它又憑什麼造成了美股的震盪?你需要知道這些:
一、DeepSeek是什麼?
簡單來說,DeepSeek是一家中國的人工智能研究公司。旗下產品爲DeepSeek,可以在PC端和移動端使用。
首先,區別於硅谷AI企業依賴明星科學家的模式,DeepSeek核心團隊不到150人,沒有“明星”,也沒有“海歸”,人才構成完全本土。
創始人樑文鋒,80後,本碩均畢業於浙江大學。他曾透露,DeepSeek員工都是一些Top高校的應屆畢業生、沒畢業的博四、博五實習生,還有一些畢業才幾年的年輕人。此前,雷軍以千萬年薪招攬的95後“天才AI少女”羅福莉,就曾是DeepSeek的團隊成員。
此外,背靠量化私募公司幻方量化,DeepSeek至今沒有融資,完全靠自有資金運行。同時,它也是國內除大廠外,唯一擁有萬張A100芯片的公司。
( 2019年,樑文鋒在金牛獎頒獎儀式上,發表主題演講《一名程序員眼裡中國量化投資的未來》,當時幻方管理的資金規模就已破百億。)
二、AI界的“拼多多”,讓硅谷連夜查賬
宣稱能力可以對標GPT系列的模型並不少,爲什麼偏偏是DeepSeek讓硅谷AI圈集體大破防?
核心在於其極致低價的模型成本。
據介紹,對標GPT-4o的模型DeepSeek-V3,僅使用了2000塊英偉達芯片,訓練成本不到558萬美元,是同類模型的1/10。
要知道,OpenAI給特朗普畫的”星際大餅“可是價值5000萬美元。
Meta內部員工更是吐槽:“我們一個高管的年薪就夠訓練整個DeepSeek模型了,而這樣的高管我們有幾十個,公司怎麼向股東交代?“
其實,早在這次產生爆炸影響力之前,DeepSeek就已經憑藉其極致性價比,在去年5月出圈。獲得“AI界拼多多”稱號的同時,也帶動國內大廠打起了大模型價格戰。
但值得注意的是,區別於賠錢換流量的模式,DeepSeek在低價的同時仍然保持盈利。
樑文鋒曾介紹:我們只是按照自己的步調來做事,然後覈算成本定價。我們的原則是不貼錢,也不賺取暴利。這個價格也是在成本之上稍微有點利潤。
三、算力神話破滅?華爾街估值地震
而DeepSeek能夠保持低成本的原因,則在於其架構創新。
其首創MLA(多頭潛在注意力機制)與DeepSeekMoE架構,將顯存佔用降至傳統模型的5%-13%,並通過強化學習實現“無監督推理突破”——模型可自主反思糾錯,甚至展示數萬字思維鏈。
換句話說,僅用很少的AI芯片,通過算力效率提高,模型也能實現同樣的智能。打破AI產業對芯片依賴迷信的同時,也無疑給那些認爲僅靠鉅額資金就能遏制競爭的巨頭們,當頭一棒。
正因如此,DeepSeek-R1發佈次日,英偉達、博通股價分別暴跌16.9%和17.4%,微軟、谷歌跟跌,歐洲ASML、西門子能源跌幅超7%。
四、挑戰OpenAI霸權,用開放擊穿閉源護城河
此外,DeepSeek更是將代碼、訓練方法、論文全部公開,並在MIT協議下允許商業應用。
在”X“上我們已經可以看到伯克利、港科大等學生已用幾十美元成功復現模型,被英偉達科學家稱爲“非美國公司踐行OpenAI初心”。
(伯克利博士用DeepSeek復現模型能力)
要知道,OpenAI的API定價幾乎爲DeepSeek的30倍,而DeepSeek應用更是當前唯一支持免費聯網與深度思考的模型。試問什麼會比免費更香?
——DeepSeek的開源生態直接動搖了硅谷“閉源壟斷——高額訂閱”的盈利邏輯。正如深度學習之父楊立昆所言:“這不是中美之爭,而是開源對閉源的超越”。
以上就是,DeepSeek此次引起巨大反響的原因。
One More Thing
更令人驚喜的是,更多人看到了DeepSeek具備的“本土靈魂”。藉着年味,小紅書上的用戶已經開始嘗試用DeepSeek寫詩,寫春聯。
(Midjourney創始人使用DeepSeek之後的評價)
而DeepSeek能夠帶來的驚喜顯然不止於此,就在今天除夕,DeepSeek再次推出新模型。
辭舊迎新,2025年的AI江湖,好戲剛剛開場。期待中國科技早日從“追趕敘事”走向“定義敘事”。