DeepSeek啓示錄:AI巨頭燒掉千億美元,很多都是浪費

2月25日消息,今年1月份,人工智能初創公司DeepSeek通過其新模型R1發佈了兩項突破性進展,悄然重新定義了人工智能經濟學。該模型以僅爲之前模型1/40的成本實現了頂級性能。而就在2024年12月份,DeepSeek的V3大語言模型已將訓練成本降低了90%以上。

DeepSeek的兩項突破性進展引發了廣泛關注:首先,DeepSeek披露,要求AI模型闡述其推理過程——這一研究方法被稱爲“思維鏈提示(chain-of-thought prompting)”——提高了準確性和效率。其次,DeepSeek利用人工智能自主生成數據集,完全不依賴人工標註數據。雖然有觀點認爲DeepSeek的成本並非如其所言那樣低,但這些突破性進展無疑開啓了人工智能經濟的新紀元。

人工智能的成本結構正在發生急劇變化。每一美元性能的飆升對初創企業、企業應用和基礎設施投資都產生了深遠影響。這種轉變可能顛覆市場力量,最終幫助靈活的初創公司在短期內趕超科技巨頭,同時提高利潤空間。

科技巨頭們已累計投入超過1000億美元用於人工智能基礎設施開發,且還在持續增加。現在,它們必須考慮如何從這些鉅額投資中獲取回報,並維持對算法的優勢,以應對更加靈活的小型市場競爭者。面對快速變化的環境,無論是科技巨頭還是初創企業,都面臨一個明確的信號:迅速抓住技術進步的機會,否則將被淘汰。

DeepSeek之前與之後的AI市場格局

在DeepSeek崛起之前,初創企業難以與科技巨頭在基礎設施支出上抗衡,這些巨頭每季度投入鉅額資金建設大型數據中心,並從人工智能技術進步中獲得了巨大優勢。這些巨頭不僅擁有海量的數據資源,還聚集了大量的博士人才,並且算法的進步也依賴於它們強大的技術實力。此外,長期建立的分銷網絡使它們能夠將產品快速推向現有客戶,並通過反饋循環加速技術進步。

然而,如今初創公司已足以與科技巨頭競爭。僅2025年,模型的訓練成本就將下降了95%,科技巨頭的基礎設施優勢被大幅削弱。過去三年,推理成本驟降近千倍,預計未來還將進一步下降。算法優勢的持續時間已縮短至45至100天,並可能繼續縮短。

當訓練成本不再是關鍵瓶頸時,推理性能(即AI模型在實時應用中的運行表現)成爲新的焦點。我們正進入一個新的階段:更小、更便宜的模型可以提供與大型模型相媲美的能力,並且可以在性能較低的GPU上運行,延長舊版GPU的使用壽命。如果更智能的AI產品能以極低成本交付,那麼初創企業終有機會超越科技巨頭,同時提高利潤。

高效的人力配置進一步強化了挑戰者的優勢。隨着不再需要僱傭大量博士級人才來組建一個具有競爭力的人工智能團隊,初創公司可以以遠低於科技巨頭的成本開發、優化和分發模型。而且,由於它們主要集中在應用層面,挑戰者能夠享受更高的利潤空間,這與15年前雲計算初創公司通過改善單位經濟效益獲得優勢一樣。

這種趨勢不僅僅對初創公司有利。它也使得像Nvidia這樣的公司面臨更大的風險。在DeepSeek宣佈之後,Nvidia的股價下跌了12%,儘管隨後有所反彈。芯片製造商面臨的風險加劇,因爲市場需求正在從側重訓練的硬件轉向更加高效的推理解決方案。消費級神經處理單元(NPU)的崛起可能會加速這一轉變,使得AI模型能夠在智能手機和筆記本電腦等設備上本地運行。

人工智能開支

對挑戰者的利好,正是科技巨頭的利空。人工智能巨頭們幾乎本能地將DeepSeek的主導地位與國家安全影響掛鉤,試圖爲其開發類似技術爭取支持,但卻忽略了包括斯坦福大學在內的美國研究人員已經能夠複製甚至超越了DeepSeek的技術。展望未來,那些在數據基礎設施項目上投入鉅額資金的企業可能會問:投入人工智能模型研發的鉅額支出是否浪費了?如果便宜的技術效果和昂貴的技術一樣好,爲什麼要花這麼多錢?

歷史趨勢表明,大多數人工智能進展確實是依賴於對規模的過度資本投入。Transformer架構之所以能成功,正是因爲過度訓練,即超出了當時認爲算法上最理想的訓練量。而新的技術進步則證明,在更低成本的情況下,我們能夠實現相同的性能。儘管像DeepSeek這樣的高效方案顯著提高了效率,但即使如此,超大規模雲服務商的推陳出新仍然需要更大的數據中心,並且必須承受不斷膨脹的推理成本。

然而,科技巨頭並未坐以待斃。我們已經看到了一場爭奪DeepSeek成就的軍備競賽,包括谷歌的Gemini模型、微軟的Azure AI Foundry(AI模型工廠)和Meta的開源LLaMA等都在爭奪主導地位。開源模型可能發揮關鍵作用。Meta首席執行官馬克·扎克伯格(Mark Zuckerberg)強調了個性化人工智能的重要性——即根據個人用戶的需求、文化和偏好量身定製的模型。這一願景與人工智能開發的更廣泛趨勢一致:更小、更專業的模型能夠在無需龐大雲基礎設施的情況下提供高性能。

初創公司贏得新籌碼

與此同時,開源與封閉源代碼巨頭的目標不同,進一步增強了挑戰者的優勢。Meta等公司創建的開源模型將持續競爭,並降低整個生態系統的成本,而閉源模型則試圖通過更好的技術收取更高的費用。初創企業可借兩大陣營的競爭博弈,在每次使用中實現最佳性價比,同時提高利潤率。

無論企業規模大小,都面臨一個明確的信息:迅速利用其可用的特定優勢——市場動態、算力和人才——否則將面臨失敗。技術進步的週期越來越短,從以前需要幾個月甚至幾年的時間來設立新的性能標準,到DeepSeek的技術突破錶明,現在可能只需要41天。創新正以前所未有的速度推進,而容錯空間也在迅速縮小。(小小)