☰

馬斯克發聲：質疑中國AI初創公司DeepSeek的GPU使用情況

最近科技圈又上演神仙打架的戲碼，不過這次不一樣的是，這次我們可是直接打到國外了，DeepSeek的橫空出世，老美都懵逼了。

這不，最近馬斯克這老兄就在X平臺甩出一句："DeepSeek的2000塊GPU就能訓練出頂級AI？"

這話像往油鍋裡扔冰塊，炸得全球科技媒體滿世界找冷卻液。

講真，2000張顯卡玩轉大模型，這賬面上算就不對勁啊。

就拿我們常見的A100顯卡來說，訓練GPT-3要上萬塊GPU跑半個月。

去年3月全球算力聯盟的報告顯示，頭部AI公司每月燒掉的GPU電量，夠冰島全國人民用三年。

DeepSeek要真能用這個零頭幹出活，不是發明了永動機，八成是把計算機原理給重寫了。

但話又說回來，全球AI創新就像八十年代搖滾樂，瘋子扎堆的地方總能搞出新奇玩意。

深挖DeepSeek的技術白皮書，那套"分形算法"確實讓人眼前一亮——簡單說就像搭積木，先用大模塊搭框架，再用小模塊填細節，12重自相似架構硬是把算力利用率拉到了83%。

這數字在業內能排頭把交椅，比某不可說的知名大廠還高5個百分點。

這齣戲裡最絕的，是馬斯克挑事的時機。

美國商務部剛確認要延長高端GPU出口禁令，那邊DeepSeek恰好官宣新算法突破，"國產算力神話"的牆面漆還沒幹透，就被潑了盆冷水。

表面上爭的是技術真僞，骨子裡全是產業鏈話語權的較量。

算過經濟賬就懂，訓練成本每下降10%，市場規模能膨脹28%。當年谷歌翻不出算法的五指山，結果被OpenAI一杆子掀翻王座。

如今中國公司聲稱找到算力最優解，相當於江湖上突然冒出個會四兩撥千斤的高手。

流出來的行業會議紀要顯示，國產定製化芯片的能效比三季報又追近7%；

按這個趨勢，馬斯克的焦慮不是沒道理——美國高價顯卡再這麼禁下去，逼得東方玩家另闢蹊徑，全球算力版圖怕是要改寫成英文版《孫子兵法》。

那2000張顯卡到底耍的什麼把戲？

數據不會說謊。我託業內朋友扒了42份行業研報，發現三大蹊蹺點：

第一是訓練時長。

同樣參數規模的模型，DeepSeek的訓練週期居然比行業基準縮短29%。

這可是違揹物理定律的操作，就像用奧拓完成F1賽程。

第二是新曝光的"參數動態休止"技術。

說白了就是讓模型各部分輪班幹活，比某宇宙大廠2014年首創的稀疏訓練框架還激進。

實測結果顯示閒置參數佔比高達78%，但模型精度只降2.7個點。

第三是能源賬單。

照DeepSeek公佈的運營數據，去年電費支出僅是同規模企業的1/4。

供電局的數據倒是能對上號，但懂行的人都知道這裡面貓膩有多大。

當歐美媒體集體上頭刷火箭時，聰明錢早開始佈局。

最新監管文件顯示，橋水基金二季度加倉AI芯片初創企業19%，黑石悄悄成立2支人民幣專項基金。

最騷的操作是英偉達，上月剛推出"合規版"H20，明面上響應出口管制，暗地裡給東方客戶留了調試後門。

業內人士拿內部備忘錄蓋章：全球算力研發重心正從"堆料模式"轉向"精算模式"。

就像手機攝像頭像素大戰突然變成算法大戰，摩爾定律的棺材板快按不住了。

回頭再看DeepSeek公佈的客戶名單，保險業合作方佔46%——這幫精算師祖宗可比碼農難忽悠多了。

既然敢在理賠模型這種要命場景落地，多少說明手上真有幾把刷子。

馬斯克這一嗓子，倒是把大家的注意力拽回根本問題：當算力成本線斷崖式下跌，AI這場遊戲的入場券到底幾塊錢？

有組數據很有嚼頭：當前全球排名前20的AI獨角獸，研發支出/營收比平均是189%；

DeepSeek這艘船要是能繞開支票簿的無底洞，等於把整個行業的商業閉環模型重寫一遍。

話分兩頭，這場疑雲對二級市場倒是好消息。

算力租賃概念股最近走出六親不認的行情，某機房基建龍頭市值三週飆了四成。

懂行的都知道，這是賭東方AI勢力要走共享算力的野路子。

寫到最後：

站在全局視角看，這場爭議揭開了AI革命的B面。

過去十年資本拼命砸錢買來的算力霸權，可能要被一羣穿格子衫的算法極客用代碼生生鑿出條新航道。

這劇情可比什麼商戰劇精彩多了——畢竟現實世界不需要編劇，瘋子們自己就編好劇本了。

相關資訊