☰

DeepSeek帶火英偉達GPU “庫存的禁售型號都搶空了”

來源：@經濟觀察報微博

記者沈怡然 2月13日，一位英偉達代理商告訴經濟觀察網記者，春節後第一週，兩家中國科技企業爲支撐開源大模型DeepSeek的推理服務，緊急向他們公司採購了L20 GPU算力設備。“去年，客戶下單總要反覆考慮和比價，現在連庫存的禁售型號都搶空了”。

DeepSeek的出現顛覆了市場將高性能GPU視爲AI賽道核心的傳統認知，導致作爲高性能GPU壟斷者的英偉達率先被市場看空。

然而，更多產業人士發現，近期，無論是高性能的H系列GPU，還是RTX 40系列的高端顯卡，英偉達的GPU重新變得供不應求。

算力需求爆發

前述英偉達代理商目前正加緊爲客戶調配英偉達的產品。他發現，英偉達芯片在中國市場全線緊缺，一些已經禁售的H800系列存貨一卡難求。

此時，接入DeepSeek的中外企業已達數百家，國內雲服務、互聯網、手機、芯片、金融、醫療、汽車等行業都在上線和部署DeepSeek。

迅速增長的用戶量爲上述企業帶來“潑天富貴”：雲服務藉此兜售算力、芯片企業藉此推廣產品、車企以更低成本升級自己的軟件、上市公司藉此推升市值。

一家IT廠商對經濟觀察網記者稱，其調用DeepSeek的平臺在上線首日增加了上萬個用戶，服務器幾乎崩潰，現有算力已經跟不上用戶的需求。團隊爲緩解壓力，不得不緊急調配更多英偉達GPU。許多上線DeepSeek的平臺顯示服務器繁忙，實際上是平臺提供的算力跟不上飛速增長的用戶需求。

向金融、科研、航空航天等企業提供超算雲服務的並行科技（839493.BJ）董事長陳健稱，模型的生命週期通常是先訓練，然後部署爲服務，最後進行推理。目前是企業在DeepSeek模型推理過程中爆發了大量算力需求。

據經濟觀察網記者統計，英偉達在中國合法銷售的型號包括：H20、L20，T4；遊戲顯卡涵蓋RTX 40系列（除RTX 4090外）和RTX 30系列及更早型號，還有新推出的RTX 5090限制版5090D。

目前市面上有十幾款國產GPU品牌，但普遍在性能、穩定性和生態上與英偉達存在一定差距，英偉達卡仍是企業們的最優選擇。

DeepSeek的R1模型發佈後，英偉達股價遭遇過去一年來最大跌幅17%，但自2月3日開始出現反彈，目前回升了13%。

國內某模型廠商一位人士對經濟觀察網記者稱，DeepSeek的出現讓業界反思算力泡沫，AI訓練是否可以不再依賴大規模的高端GPU集羣，但是隨着提供模型和使用模型的個人和企業都在爆發式增長，大量的模型推理再一次推升了對英偉達卡的需求。

陳健認爲，DeepSeek帶給產業界的震動是AIGC大模型訓練、推理算力消耗大幅降低。相比模型推理，模型訓練的需求並沒有在短期內出現爆發式增長。

算力需求可持續嗎？

DeepSeek展現出強大的推理能力與優秀的文采，但是提供DeepSeek服務的代價也很大。

上述國內模型廠商人士表示，目前DeepSeek滿血版對硬件配置要求非常高，至少需要兩臺H800卡才能運行起來，而國內大多數基礎模型只需要一臺4090卡就能運行。

通常來說，模型能力與參數量和精度密切相關，參數量影響AI的知識量，精度影響AI的準確性和推理能力，這也是爲什麼很多平臺上線的DeepSeek看起來“智商”不足，因爲背後的算力不足以支持模型在參數量和精度上達到最佳狀態。

不過，上述國內模型廠商人士認爲，這種急迫的算力需求未必持續很久。在實際應用中，開發者通常會將超過600B參數量的模型進行蒸餾，壓縮到更低參數規模，再用於商業化。而DeepSeek發展得太快以至於團隊還沒來得及完成蒸餾，可能後續幾個月蒸餾好後，那些上線DeepSeek的企業可以節約一些推理算力。

相關資訊