阿里雲副總裁談DeepSeek開源周,李飛飛稱大模型預訓練將走向寡頭化
來源:第一財經
【#阿里雲副總裁談DeepSeek開源周#,#李飛飛稱大模型預訓練將走向寡頭化#】“AI下半場的競爭又回到了傳統的系統領域”,2月26日,阿里雲智能集團副總裁、數據庫產品事業部負責人李飛飛在2025阿里雲PolarDB開發者大會上談到對DeepSeek近日開源周相關發佈的看法,他認爲,隨着DeepSeek的火爆,一個背後趨勢是,AI的下半場競爭又回到了傳統的系統領域,是分佈式系統工程的事情。
“AI的第一波浪潮來自於做模型、算法、Transformer等機制的研究,但當AI進入下半場,大家會發現在模型的算法和框架上實際沒有太大的創新和突破,大的模型框架算法過去兩年沒有大的變化。如今花昂貴的錢去招一個很懂算法的人所帶來的收益可能不如去招一幫幹數據庫、分佈式系統幹了很多年的人。”李飛飛表示。
對於DeepSeek開源周的相關發佈,他分析,DeepSeek的一系列優化包括FlashMLA的分段配置等,是把Linux、OS、Kernel裡的思路放在GPU的緩存上又去實現了一遍。這些東西在數據庫系統裡已經實現了很多年,只不過今天在GPU的新的硬件框架上,DeepSeek的創新產生巨大的價值,它可能帶來的是硬件結構的巨大變化。
此外,李飛飛還預測,未來,大模型預訓練一定是中心化和寡頭化的,全世界可能只有幾家。尤其是目前還沒看到世界任何一家大模型商業模式實現閉環的情況下,這就是一個燒錢的無底洞,除非有一天它突破了AGI的門檻,自己成爲印鈔機。但DeepSeek橫空出世讓開源模型具備了複雜的邏輯推理能力,同時帶來推理成本的大幅下降。目前,阿里雲正在GPU加CPU的異構資源池上做優化,未來,數據庫要研發的關鍵能力也是要將昂貴的GPU儘可能地省下來做最珍貴的計算和緩存,將次要的計算和緩存推到CPU加內存和存儲的三層池化中,讓在線推理變得更低成本。