DeepSeek 動搖 AI 舊秩序 但靠的不是「低成本」而是「開源」

源自中國的DeepSeek正在動搖全球的AI研發格局。 圖/日經中文網

吉川和輝:中國的人工智慧(AI)企業DeepSeek研發出了高性能、低成本的人工智慧模型,正在動搖在美國企業主導下發展起來的最尖端AI研發格局。這是因爲DeepSeek的AI模型以任何人都可以使用的「開源」形式提供,隨着其滲透,有可能從根本上打破美國OpenAI和軟銀集團(SBG)等將啓動的AI研發項目「星際之門(Stargate)計劃」等美國的封閉研發體制。

對「低成本」的強調可能過於誇張

DeepSeek的最新AI模型「R1」最初被隆重地報道爲是以「壓倒性的低成本」研發的。部分媒體報道了560萬美元這一極低的研發費用,但DeepSeek方面解釋稱,這是在R1之前於2024年12月發佈的AI模型「V3」的訓練費。

R1是以通過大量圖形處理器(GPU)和大規模數據學習的V3爲基礎,通過在反覆試錯過程中加以學習的「強化學習」來提高邏輯推理能力的模型。由於強化學習不需要大量的計算資源,因此對R1研發費用規模的估算必須把V3考慮在內。半導體行業分析公司Semi Analysis指出,所謂V3花費的560萬美元僅指GPU租用費,整體的研發費用有可能達到13億美元。

以「開源」形式發佈

R1的低成本容易被言過其實地強調,但其實可能更應該關注花費相應成本研發的最尖端AI模型以開源形式發佈這一點。開源是指公開模型和軟體的源代碼,允許使用、複製、修改和再分發等。R1是在開源之中限制尤其寬鬆的「MIT許可證」下發布。

這與OpenAI、谷歌和Anthropic等美國主要AI企業採取的不公開模型源代碼、限制使用的「專有(proprietary)」方式形成了鮮明對比。R1本身也可以下載,如果企業採取在自家公司或本國伺服器上部署的方法,就可以降低數據泄露風險。

R1自1月20日發佈以來,截至1月底在全球已被下載約84萬次。吸收其他企業開源模型知識而研發的衍生模型也有6種被公開,每一種都被下載10萬次以上。在美國蘋果的「App Store」免費應用排行榜上,DeepSeek也一度超越ChatGPT等,位居榜首。

美國亞馬遜旗下的亞馬遜網路服務(AWS)開始了研發和使用R1的雲服務。此前有報導稱美國微軟因懷疑DeepSeek存在數據違規利用而與OpenAI一起展開調查,但目前也開始在自己的雲服務「Azure」上提供R1服務。

關注原創的研發方法

R1的性能與2024年12月正式發佈的OpenAI「o1」相差無幾,但很多專家關注其原創的研發方法。R1採用了一種名爲「GRPO」的提高強化學習效率的新研發的演算法。另外研發出僅利用強化學習來獲得高度推理能力的模型「R1-Zero」,這一點也受到好評。

發佈AI模型「o1」正式版的美國OpenAI的現場活動(2024年12月5日)。 圖/日經中文網

作爲有助於實現AI自主完成工作的「AI Agent(智慧體)」、能像人類一樣完成廣泛任務的未來的通用AI(AGI)以及更遠未來的超級人工智慧(ASI)的新型大語言模型(LLM),像R1這樣的推理加強型AI模型正受到關注。

世界上最早的推理加強型AI模型是OpenAI在2024年9月發表的「o1-preview」。僅僅2個月後,DeepSeek和中國阿里巴巴集團等於11月相繼發表了推理加強型模型。中國AI企業的技術實力和研究人才的充實程度從那時起就備受關注。

封閉的研發體制或將變得無力

在美國,從2024年下半年開始,對中國AI研發感到警戒的看法急速增強,到11月,美國國會的跨黨派的美中經濟與安全審查委員會(USCC)提議,AI研發應該以過去的有關原子彈研發的曼哈頓計劃爲範本推進。從安全保障的觀點來看,川普執政的4年內總投資5,000億美元的星際之門計劃很有可能採取類似曼哈頓計劃的秘密研發體制。

然而,這種封閉的研發體制有可能因此次DeepSeek所展示的中國企業的技術實力和基於開源的創新而變得無力。隨着AI模型在長期變爲「大路貨」,附加價值提高的並不是模型本身,而是AI應用領域,在AI模型研發方面落後於中美的日本或許也會迎來機會。日本需要在考慮AI的軍民兩方面衝擊的同時制定研發戰略。

日本經濟新聞(中文版:日經中文網) 編輯委員 吉川和輝

本文轉載自日經中文網,不代表本社立場,第三方未經授權不得轉載或使用

原文標題:DeepSeek的開源戰略動搖AI舊秩序