外媒再議DeepSeek:太愛編故事,但仍然是潛力股

2月27日消息,中國人工智能公司DeepSeek在1月發佈其最新模型DeepSeek-R1後迅速崛起,短暫取代OpenAI的ChatGPT成爲蘋果應用商店下載量第一的免費應用。與此同時,幕後推動AI發展的“賦能者”(即開發AI基礎設施與應用的公司)則感受到市場震盪的衝擊。

DeepSeek的出現讓人工智能行業的許多人重新評估人工智能模型開發所需的資源,市場意識到人工智能模型的開發可以用更低的成本、更少的算力來完成,這導致英偉達的股票在單日內跌幅超過15%。不過,這些人工智能基礎設施供應商依然在繼續開發專爲人工智能設計的半導體芯片,擴展計算能力,併爲基礎模型提供運行平臺。

企業人工智能平臺Kolena的聯合創始人兼首席執行官穆罕默德·埃爾根迪(Mohamed Elgendy)表示:“DeepSeek的方案證明,通過優化模型構建流程可大幅減少算力需求,這對英偉達來說是個糟糕的消息。然而,現在會有更多公司開始構建基礎模型,而不再被那些擁有大量基礎設施預算的頂級公司所壟斷。”

英偉達股價在2025年迄今下跌了近9%,但這是在過去兩年股價飆升近500%之後的回調。英偉達於美國當地時間週三收盤後發佈了第四季度財報,華爾街分析師和投資者正密切關注DeepSeek及其對“超大規模企業”(如谷歌、甲骨文、亞馬遜和微軟)未來支出的潛在影響。這些企業購買了英偉達近一半的人工智能芯片。

埃爾根迪認爲,DeepSeek發佈的模型標誌着人工智能行業的轉折點,未來將朝着更加民主化的方向發展。研究人員表示,市場上已經出現了低至50美元的LLM(大語言模型)。他特別強調:“DeepSeek問世前後的行業格局已截然不同。”

基礎世界模型公司Integral AI的首席執行官賈德·塔裡夫(Jad Tarifi)在其2024年著作《超級智能的崛起》中寫道:“儘管許多研究人員專注於提高人工智能模型的計算和數據效率,但對強大基礎設施的需求仍將至關重要。即便模型趨向輕量化,預期中的實際部署仍將確保對強大算力資源的需求持續增長。”

企業AI智能體公司Vectara的首席執行官艾姆爾·阿瓦達拉(Amr Awadallah)則有略微不同的看法。他認爲:“這是人工智能模型構建者和大型人工智能基礎設施提供商利潤率壓縮的開始。整個行業收入將繼續增長,甚至大幅增長,但這些大公司能夠提取的利潤將顯著下降,因此會帶來一定的壓力。”

近期有報道稱微軟正在縮減其人工智能數據中心的建設規模,這引發了投資者的擔憂。但微軟對此予以否認,表示仍致力於實施其800億美元的支出計劃,但可能會“根據需要在某些基礎設施領域進行戰略性調整”。

阿瓦達拉將這一轉變比作閃存驅動器的發展史:早期需要大量設計和開發,但如今已成爲利潤較低的普通商品。他認爲,DeepSeek能夠在低端硬件上訓練其模型,而無需依賴美國大公司使用的高端硬件,實質上加速了市場商品化進程。

DeepSeek的模型運行在英特爾的Xeon和Gaudi處理器上。英特爾發言人表示,這些處理器“幫助客戶以更低的成本獲得強勁性能”。英特爾的Gaudi還被用於Denvr Dataworks,該公司提供兼顧性能和數據隱私的人工智能解決方案。

英特爾發言人補充稱:“新的人工智能模型帶來了令人興奮的機會,但也提出了重要的考量。它們可以推動創新、提高效率並解鎖新的可能性,但擴展人工智能的規模,仍然面臨成本、能源使用和負責任部署等挑戰。”不過,英特爾表示,其產品和服務已考慮到這些障礙。

一個有潛力的“不完美”模型

儘管業界預期DeepSeek模型會隨時間推移逐步改進,但其準確性缺陷已廣爲人知。Vectara測試顯示,DeepSeek-R1的“幻覺”率高達14.3%,遠超OpenAI GPT-4的約2%,甚至高於其自身不具備推理能力的前代模型DeepSeek-V3。Kolena首席執行官埃爾根迪指出:“在對比測試中,DeepSeek在多數對抗性攻擊(如越獄型攻擊)中表現脆弱。這類問題曾是GPT-3數年前的短板,但主流廠商現已全面解決。”

儘管如此,埃爾根迪認爲DeepSeek(或其代表的路徑)猶如未經雕琢的璞玉。他表示:“我們已看到一種更高效的大型模型訓練方法,且該方法確實有效。”

阿瓦達拉則認爲,DeepSeek宣稱僅用600萬美元訓練其模型的說法並不準確。他說:“我們都認爲它的實際成本遠高於此。也許最終模型的訓練只花了600萬美元,但通常需要進行許多次訓練才能獲得一個有效的模型。我估計它的訓練成本至少爲5000萬美元,甚至更多。”不過,這與谷歌Gemini的1.49億美元相比仍然要便宜很多,這甚至還未計算谷歌員工薪水。

埃爾根迪斷言,以有限預算和低算力構建的基礎模型將加速涌現:“此前我們認爲基礎模型需天量資源,但DeepSeek讓遙不可及之事成爲現實。此舉或使開發者數量增長10倍、用戶規模擴大100倍。”

他特別期待在醫療、研究、製藥、會計、金融等特定領域出現更多基礎模型。埃爾根迪說:“基礎設施或將回歸早期機器學習階段——專業公司開發垂直領域基礎模型,而這一切仍需底層支持。我相信測試和驗證將成爲最重要的部分,因爲其他組件已經商品化。”

關於測試,埃爾根迪表示:“隨着提供商增多,競爭也會加劇。DeepSeek一經發布,全行業即展開測試,其能力邊界與漏洞迅速暴露無遺。”他認爲,市場競爭將起到監督作用,因爲“市場現在就在充當監管者的角色” 。

英偉達首席執行官黃仁勳在最近的一次預錄採訪中表示:“市場對R1的反應是,‘天哪,人工智能開發已經完成了’,認爲人工智能不再需要更多計算了。但事實恰恰相反。”

考慮到DeepSeek及類似模型的巨大潛力,阿瓦達拉認爲,人工智能基礎設施提供商(如英偉達)之間的競爭將更加激烈。他表示:“只有那些能夠在利潤率下降的情況下依然屹立不倒的公司,方可立於不敗之地。”(小小)