國泰君安:DEEPSEEK開源低成本模型引發行業巨震

智通財經APP獲悉,國泰君安發佈研報稱,DeepSeek R1具備優異性價比,其蒸餾所得小模型推理性能優越,將加速端側AI落地。目前硅基流動推出基於昇騰雲的DeepSeek R1&V3 推理服務,有望引領國產AI算力、AI芯片技術生態、AI大模型閉環,國產算力產業鏈及端側硬件有望受益。

國泰君安主要觀點如下:

DeepSeek R1 API定價最低僅爲1元/百萬tokens,性能對標O1模型,霸榜蘋果應用商店140+國家/地區免費應用第一名

根據Deepseek官網,Deepseek R1 API服務定價爲0.14 美元/百萬輸入tokens(緩存命中),2.19美元/百萬輸出tokens。其在邏輯、數學及中文任務中表現出色,性能優於GPT-4o、O1-mini等模型。優異性價比驅動用戶數量快速增長,上線18天日活即破1500萬,增速達Chatgpt 13倍,並且霸榜蘋果應用商店140+國家/地區免費應用第一名。未來用戶數量有望加速提高,帶動DeepSeek 服務器算力需求增長。

多token並行與FP8 訓練提升V3訓練效率,強化學習提高R1推理性能,R1蒸餾驅動端側小模型落地

DeepSeek V3:(1)首創無輔助損失負載均衡策略,避免專家負載失衡。(2)通過採用多token並行預測與FP8混合精度訓練,提高訓練信號密度,提升模型推理能力,同時降低訓練所需算力。(3)在訓練框架中採用DualPipe算法,減少流水線空泡,通過計算-通信重疊隱藏大部分通信延遲。DeepSeek R1:通過引入冷啓動數據微調DeepSeek-V3-Base模型以及多階段訓練優化,其推理任務水平達到OpenAI-o1-1217。並且基於其高質量訓練樣本蒸餾所得的DeepSeek-R1-Distill-Qwen-7B,推理性能超越QwQ-32B-Preview。DeepSeek R1蒸餾所得的高推理性能小模型將加速端側AI落地,驅動AI手機、AI PC、AI眼鏡等硬件出貨量上行。

海外巨頭紛紛接入,昇騰雲攜手引領國產AI閉環

基於出色的推理性能及低廉的使用成本,目前微軟、英偉達、亞馬遜等海外巨頭已接入DeepSeek R1 API。硅基流動已推出基於昇騰雲服務的DeepSeek模型,其採用華爲自研推理加速引擎,性能持平全球高端GPU部署模型效果。昇騰雲與DeepSeek合作有望推動國產AI芯片、AI芯片技術生態與AI大模型閉環,加速國產AI算力生態自主可控。

投資建議

推薦中芯國際(00981,688981.SH)、華豐科技(688629.SH),中興通訊(00763,000063.SZ)、聯想集團(00992)、申菱環境(301018.SZ)、泰嘉股份(002843.SZ)等預計受益。

風險提示:端側模型落地進展不及預期;AI技術迭代不及預期。