DeepSeek帶火英偉達GPU “庫存的禁售型號都搶空了”

來源:@經濟觀察報微博

記者 沈怡然 2月13日,一位英偉達代理商告訴經濟觀察網記者,春節後第一週,兩家中國科技企業爲支撐開源大模型DeepSeek的推理服務,緊急向他們公司採購了L20 GPU算力設備。“去年,客戶下單總要反覆考慮和比價,現在連庫存的禁售型號都搶空了”。

DeepSeek的出現顛覆了市場將高性能GPU視爲AI賽道核心的傳統認知,導致作爲高性能GPU壟斷者的英偉達率先被市場看空。

然而,更多產業人士發現,近期,無論是高性能的H系列GPU,還是RTX 40系列的高端顯卡,英偉達的GPU重新變得供不應求。

算力需求爆發

前述英偉達代理商目前正加緊爲客戶調配英偉達的產品。他發現,英偉達芯片在中國市場全線緊缺,一些已經禁售的H800系列存貨一卡難求。

此時,接入DeepSeek的中外企業已達數百家,國內雲服務、互聯網、手機、芯片、金融、醫療、汽車等行業都在上線和部署DeepSeek。

迅速增長的用戶量爲上述企業帶來“潑天富貴”:雲服務藉此兜售算力、芯片企業藉此推廣產品、車企以更低成本升級自己的軟件、上市公司藉此推升市值。

一家IT廠商對經濟觀察網記者稱,其調用DeepSeek的平臺在上線首日增加了上萬個用戶,服務器幾乎崩潰,現有算力已經跟不上用戶的需求。團隊爲緩解壓力,不得不緊急調配更多英偉達GPU。許多上線DeepSeek的平臺顯示服務器繁忙,實際上是平臺提供的算力跟不上飛速增長的用戶需求。

向金融、科研、航空航天等企業提供超算雲服務的並行科技(839493.BJ)董事長陳健稱,模型的生命週期通常是先訓練,然後部署爲服務,最後進行推理。目前是企業在DeepSeek模型推理過程中爆發了大量算力需求。

據經濟觀察網記者統計,英偉達在中國合法銷售的型號包括:H20、L20,T4;遊戲顯卡涵蓋RTX 40系列(除RTX 4090外)和RTX 30系列及更早型號,還有新推出的RTX 5090限制版5090D。

目前市面上有十幾款國產GPU品牌,但普遍在性能、穩定性和生態上與英偉達存在一定差距,英偉達卡仍是企業們的最優選擇。

DeepSeek的R1模型發佈後,英偉達股價遭遇過去一年來最大跌幅17%,但自2月3日開始出現反彈,目前回升了13%。

國內某模型廠商一位人士對經濟觀察網記者稱,DeepSeek的出現讓業界反思算力泡沫,AI訓練是否可以不再依賴大規模的高端GPU集羣,但是隨着提供模型和使用模型的個人和企業都在爆發式增長,大量的模型推理再一次推升了對英偉達卡的需求。

陳健認爲,DeepSeek帶給產業界的震動是AIGC大模型訓練、推理算力消耗大幅降低。相比模型推理,模型訓練的需求並沒有在短期內出現爆發式增長。

算力需求可持續嗎?

DeepSeek展現出強大的推理能力與優秀的文采,但是提供DeepSeek服務的代價也很大。

上述國內模型廠商人士表示,目前DeepSeek滿血版對硬件配置要求非常高,至少需要兩臺H800卡才能運行起來,而國內大多數基礎模型只需要一臺4090卡就能運行。

通常來說,模型能力與參數量和精度密切相關,參數量影響AI的知識量,精度影響AI的準確性和推理能力,這也是爲什麼很多平臺上線的DeepSeek看起來“智商”不足,因爲背後的算力不足以支持模型在參數量和精度上達到最佳狀態。

不過,上述國內模型廠商人士認爲,這種急迫的算力需求未必持續很久。在實際應用中,開發者通常會將超過600B參數量的模型進行蒸餾,壓縮到更低參數規模,再用於商業化。而DeepSeek發展得太快以至於團隊還沒來得及完成蒸餾,可能後續幾個月蒸餾好後,那些上線DeepSeek的企業可以節約一些推理算力。