☰

DeepSeek撼動AI圈美2巨頭成「意外」贏家

大陸的AI程式Deepseek一夕竄紅。（路透社）

中國DeepSeek的創新技術給生成式AI生態圈投下震撼彈，投資顧問公司The Motley Fool點名兩家美國科技大廠可能是出乎意料之外的大贏家。

DeepSeek宣稱以不可思議的560萬美元超低成本打造出媲美ChatGPT的AI模型。相較之下，OpenAI爲了訓練GPT-4砸下1億美元。

分析指出，DeepSeek令人驚豔之處在於讓它有限的硬體達到效能的最大化。受限於美國的AI晶片出口禁令，輝達最強大的GPU晶片H100不得賣給中國，只能提供中國企業降規版的H800晶片。爲了儘可能將該降規版晶片的效能放到最大，DeepSeek開發出能減少傳輸資料量的技術，例如該公司去年推出的「混合專家」模型DeepSeekMoE，只需啓動模型的一部分即可迴應用戶查詢。

換句話說，AI推理的取得將變得容易許多，未來隨身放在口袋裡的裝置就可以運行AI系統，且成本低廉，而兩家科技大廠可望成爲最大的贏家：蘋果和Meta Platforms。分析指出，DeepSeek的AI技術可望實現終端裝置的AI（On-device AI），而將用戶隱私視爲首要之務的蘋果可望受惠。

臉書母公司Meta Platforms則將受惠於把AI推廣給30億用戶。Meta決定讓自家的Llama成爲開源式AI模型，而DeepSeek使用Llama作爲開發R1模型的基礎，這正是Meta希望看到的。降低AI推理的成本可望爲Meta解鎖龐大的獲利，而DeepSeek提出瞭解方，爲Meta將AI拓展到其30億用戶提供了利器。

不過，DeepSeek雖宣稱其媲美OpenAI生成式聊天機器人ChatGPT的AI模型「V3」只花費557.6萬美元且僅使用2048顆輝達H800晶片，但晶片研究機構Semianalysis日前出具報告指出，DeepSeek的硬體支出其實遠超出5億美元。

該分析報告指出DeepSeek使用5萬顆輝達Hopper架構GPU，其中包括1萬顆H800和1萬顆H100，以及一些中國特供版H20。以此估算，DeepSeek的總資本支出約爲16億美元，其中對GPU的投資額達超出5億美元。

DeepSeek撼動AI圈 美2巨頭成「意外」贏家

相關資訊

DeepSeek撼動AI圈美2巨頭成「意外」贏家