DeepSeek撼動AI圈 美2巨頭成「意外」贏家

大陸的AI程式Deepseek一夕竄紅。(路透社)

中國DeepSeek的創新技術給生成式AI生態圈投下震撼彈,投資顧問公司The Motley Fool點名兩家美國科技大廠可能是出乎意料之外的大贏家。

DeepSeek宣稱以不可思議的560萬美元超低成本打造出媲美ChatGPT的AI模型。相較之下,OpenAI爲了訓練GPT-4砸下1億美元。

分析指出,DeepSeek令人驚豔之處在於讓它有限的硬體達到效能的最大化。受限於美國的AI晶片出口禁令,輝達最強大的GPU晶片H100不得賣給中國,只能提供中國企業降規版的H800晶片。爲了儘可能將該降規版晶片的效能放到最大,DeepSeek開發出能減少傳輸資料量的技術,例如該公司去年推出的「混合專家」模型DeepSeekMoE,只需啓動模型的一部分即可迴應用戶查詢。

換句話說,AI推理的取得將變得容易許多,未來隨身放在口袋裡的裝置就可以運行AI系統,且成本低廉,而兩家科技大廠可望成爲最大的贏家:蘋果和Meta Platforms。分析指出,DeepSeek的AI技術可望實現終端裝置的AI(On-device AI),而將用戶隱私視爲首要之務的蘋果可望受惠。

臉書母公司Meta Platforms則將受惠於把AI推廣給30億用戶。Meta決定讓自家的Llama成爲開源式AI模型,而DeepSeek使用Llama作爲開發R1模型的基礎,這正是Meta希望看到的。降低AI推理的成本可望爲Meta解鎖龐大的獲利,而DeepSeek提出瞭解方,爲Meta將AI拓展到其30億用戶提供了利器。

不過,DeepSeek雖宣稱其媲美OpenAI生成式聊天機器人ChatGPT的AI模型「V3」只花費557.6萬美元且僅使用2048顆輝達H800晶片,但晶片研究機構Semianalysis日前出具報告指出,DeepSeek的硬體支出其實遠超出5億美元。

該分析報告指出DeepSeek使用5萬顆輝達Hopper架構GPU,其中包括1萬顆H800和1萬顆H100,以及一些中國特供版H20。以此估算,DeepSeek的總資本支出約爲16億美元,其中對GPU的投資額達超出5億美元。