馬斯克發聲:質疑中國AI初創公司DeepSeek的GPU使用情況
最近科技圈又上演神仙打架的戲碼,不過這次不一樣的是,這次我們可是直接打到國外了,DeepSeek的橫空出世,老美都懵逼了。
這不,最近馬斯克這老兄就在X平臺甩出一句:"DeepSeek的2000塊GPU就能訓練出頂級AI?"
這話像往油鍋裡扔冰塊,炸得全球科技媒體滿世界找冷卻液。
講真,2000張顯卡玩轉大模型,這賬面上算就不對勁啊。
就拿我們常見的A100顯卡來說,訓練GPT-3要上萬塊GPU跑半個月。
去年3月全球算力聯盟的報告顯示,頭部AI公司每月燒掉的GPU電量,夠冰島全國人民用三年。
DeepSeek要真能用這個零頭幹出活,不是發明了永動機,八成是把計算機原理給重寫了。
但話又說回來,全球AI創新就像八十年代搖滾樂,瘋子扎堆的地方總能搞出新奇玩意。
深挖DeepSeek的技術白皮書,那套"分形算法"確實讓人眼前一亮——簡單說就像搭積木,先用大模塊搭框架,再用小模塊填細節,12重自相似架構硬是把算力利用率拉到了83%。
這數字在業內能排頭把交椅,比某不可說的知名大廠還高5個百分點。
這齣戲裡最絕的,是馬斯克挑事的時機。
美國商務部剛確認要延長高端GPU出口禁令,那邊DeepSeek恰好官宣新算法突破,"國產算力神話"的牆面漆還沒幹透,就被潑了盆冷水。
表面上爭的是技術真僞,骨子裡全是產業鏈話語權的較量。
算過經濟賬就懂,訓練成本每下降10%,市場規模能膨脹28%。當年谷歌翻不出算法的五指山,結果被OpenAI一杆子掀翻王座。
如今中國公司聲稱找到算力最優解,相當於江湖上突然冒出個會四兩撥千斤的高手。
流出來的行業會議紀要顯示,國產定製化芯片的能效比三季報又追近7%;
按這個趨勢,馬斯克的焦慮不是沒道理——美國高價顯卡再這麼禁下去,逼得東方玩家另闢蹊徑,全球算力版圖怕是要改寫成英文版《孫子兵法》。
那2000張顯卡到底耍的什麼把戲?
數據不會說謊。我託業內朋友扒了42份行業研報,發現三大蹊蹺點:
第一是訓練時長。
同樣參數規模的模型,DeepSeek的訓練週期居然比行業基準縮短29%。
這可是違揹物理定律的操作,就像用奧拓完成F1賽程。
第二是新曝光的"參數動態休止"技術。
說白了就是讓模型各部分輪班幹活,比某宇宙大廠2014年首創的稀疏訓練框架還激進。
實測結果顯示閒置參數佔比高達78%,但模型精度只降2.7個點。
第三是能源賬單。
照DeepSeek公佈的運營數據,去年電費支出僅是同規模企業的1/4。
供電局的數據倒是能對上號,但懂行的人都知道這裡面貓膩有多大。
當歐美媒體集體上頭刷火箭時,聰明錢早開始佈局。
最新監管文件顯示,橋水基金二季度加倉AI芯片初創企業19%,黑石悄悄成立2支人民幣專項基金。
最騷的操作是英偉達,上月剛推出"合規版"H20,明面上響應出口管制,暗地裡給東方客戶留了調試後門。
業內人士拿內部備忘錄蓋章:全球算力研發重心正從"堆料模式"轉向"精算模式"。
就像手機攝像頭像素大戰突然變成算法大戰,摩爾定律的棺材板快按不住了。
回頭再看DeepSeek公佈的客戶名單,保險業合作方佔46%——這幫精算師祖宗可比碼農難忽悠多了。
既然敢在理賠模型這種要命場景落地,多少說明手上真有幾把刷子。
馬斯克這一嗓子,倒是把大家的注意力拽回根本問題:當算力成本線斷崖式下跌,AI這場遊戲的入場券到底幾塊錢?
有組數據很有嚼頭:當前全球排名前20的AI獨角獸,研發支出/營收比平均是189%;
DeepSeek這艘船要是能繞開支票簿的無底洞,等於把整個行業的商業閉環模型重寫一遍。
話分兩頭,這場疑雲對二級市場倒是好消息。
算力租賃概念股最近走出六親不認的行情,某機房基建龍頭市值三週飆了四成。
懂行的都知道,這是賭東方AI勢力要走共享算力的野路子。
寫到最後:
站在全局視角看,這場爭議揭開了AI革命的B面。
過去十年資本拼命砸錢買來的算力霸權,可能要被一羣穿格子衫的算法極客用代碼生生鑿出條新航道。
這劇情可比什麼商戰劇精彩多了——畢竟現實世界不需要編劇,瘋子們自己就編好劇本了。