國泰君安:Deepseek鏈式反應顛覆產業生態 看好國產推理算力爆發
智通財經APP獲悉,國泰君安證券發佈研報稱,Deepseek通過算法優化降低模型訓練與推理成本,開創了全新的大模型研發範式,極大地降低了對硬件算力的需求,這些創新突破共同構建了對"算力軍備競賽"發展路徑的系統性顛覆。預計雲服務廠商將迎來一波新的增長勢頭,短期來看現階段本地部署可能是最適合大型企業和特殊行業企業的AI調用方式。該行看好本地國產推理算力的爆發,以及如向量數據庫等新型基礎軟件的擴圈。
國泰君安證券主要觀點如下:
Deepseek以“單位算力效能提升10倍”爲目標,通過算法優化降低模型訓練與推理成本。Deepseek打破了AI大模型領域“拼投入” 的固有觀念,以極低的成本實現了與行業巨頭相媲美的模型性能。在訓練成本方面,訓練671B的DeepSeek V3的成本是557.6萬美元(約合4070萬人民幣),僅爲Llama 3的7%,而OpenAI訓練ChatGPT-4o所花費的成本高達7800萬美元甚至是1億美元,還需要上萬張英偉達H100芯片,相比之下DeepSeek-V3在訓練時使用的GPU是英偉達的H800,一款在性能上被削弱的特供AI芯片。如今DeepSeek-R1用不到GPT 5%的成本,便獲得了和OpenAI的頂尖推理模型o1相當的能力。同時公司採用MIT協議全棧開源,包括模型權重、訓練代碼及部署工具鏈,吸引全球開發者共建生態。
DeepSeek的技術革命性在於其開創了全新的大模型研發範式。首先DeepSeek採用了MoE和MLA兩大創新架構來實現高效的推理和成本效益高的訓練;算法層面,動態稀疏化專家網絡設計(Dynamic MoE),使模型推理過程中僅需調用不足4%的神經網絡參數;工程層面,Deepseek採用FP8低精度訓練框架,相比傳統32位計算方案,能耗降幅高達80%的同時保持模型收斂穩定性;尤爲突破的是DeepSeek R1引入的強化學習驅動範式擺脫了對SFT的依賴,通過自演進式訓練機制,其基於強化學習的冷啓動策略僅需行業基準值1/5的標註數據量即可完成高效訓練。這些創新突破共同構建了對"算力軍備競賽"發展路徑的系統性顛覆。
開源模型DeepSeek在當下的AI時代將扮演重要角色,就像Android之於移動互聯網革命。它會重構產業生態,引發鏈式反應,加速上層應用發展與下層系統統一。這將調動起跨越軟硬件和上下游的生態力量,促使各方加大“模型-芯片-系統”協同優化與垂直打通的投入,進一步削弱CUDA生態優勢,爲國產AI產業發展創造機遇。DeepSeek通過技術創新,在AI模型訓練過程中實現了對高端進口芯片依賴的降低,這爲國內企業展示了一條可行的技術路徑,極大地增強了國內企業自主研發算力芯片的信心。
風險提示:技術研發進展不及預期、資本投入不及預期、市場競爭加劇的風險。