☰

大模型降本增效時代來臨，DeepSeek技術路徑深度剖析

本文轉載自微信公衆號：國泰君安證券研究

2025年成爲人工智能發展的關鍵節點，大模型推理能力躍升，強化學習與知識蒸餾技術提升算法效率，推動AI從單模態向通用智能跨越。在開源與閉源雙軌競爭下，開源模型以低成本賦能行業，而閉源模型依託多模態壁壘保持領先，形成“技術共享+專有壟斷”並存格局。同時，AI智能體革命加速生產力變革，推動自動化決策與自主執行。全球AI產業規模指數級增長，2025年市場預計達7576億美元。在此背景下，DeepSeek系列模型不斷創新，V2引入MoE架構提升效率，V3通過FP8低精度訓練降低計算成本，而R1開創純強化學習推理模式，在數學推理和代碼生成能力上媲美GPT-4o，推動開源AI生態發展，加速行業應用落地。

DeepSeek V3通過6710億參數MoE架構、MLA壓縮技術、MTP預測等創新，實現低成本、高穩定性的超大規模模型訓練，在數學、代碼與多語言任務中達到開源模型性能巔峰。其MoE架構採用256個路由專家+1個共享專家模式，每個token僅激活8個路由專家+1個共享專家，相較傳統Transformer大幅降低計算成本與顯存佔用。MLA機制利用低秩聯合壓縮技術優化長序列處理，將KV緩存需求降低80%，提高推理效率。無輔助損失的負載均衡策略通過動態偏置調控優化訓練穩定性，而MTP多步預測技術基於分階段協作，使訓練速度提升1.8倍，提升複雜任務解決能力。

DeepSeek R1基於V3，以強化學習訓練爲核心，通過冷啓動數據、多階段優化、模型蒸餾等創新，在數學推理、代碼生成等領域達到頂尖模型水平，並實現高效推理和輕量化部署。其無監督版本R1-Zero創新採用組相對策略優化算法，通過組內答案比較優化策略，降低訓練成本並提升推理能力。R1在此基礎上，通過長思維鏈微調、雙獎勵強化學習、拒絕採樣及監督微調等多階段優化，增強語言一致性和推理質量。在數學、代碼、長文本及知識任務中，DeepSeek-R1超越多款閉源模型，並在MATH-500等測試中取得領先成績。同時，MoE架構優化、FP8混合精度訓練、DualPipe通信等技術顯著降低訓練和部署成本，其預訓練成本僅爲557.6萬美元，遠低於GPT-4o及Llama 3.1，API成本優勢達27倍，成爲開源領域高效能、低成本AI的標杆。

DeepSeek R1通過開源策略、技術突破和成本優化，推動全球AI大模型普惠化，並在B端和C端市場加速AI商業化應用落地。其MIT許可開源模式降低企業獲取AI的門檻，使開發者可低成本構建垂直領域AI，推動算力民主化，並促使OpenAI等閉源巨頭調整策略。R1在強化學習、蒸餾等核心算法上的領先性增強了中國AI競爭力，同時，其私有化部署、聯邦學習和模塊化定製滿足B端對數據安全與定製化的需求，加速企業級AI需求爆發。在C端，AI搜索、智能助手、AI手機等應用場景快速增長，AI終端設備推動個性化交互體驗升級，使AI原生應用進入發展快車道。

風險提示：算力供應鏈自主性風險、商業化變現能力不及預期、監管與安全風險。

文章來源

本文摘自：2025年4月29日發佈的大模型降本增效時代開啓，DeepSeek效率提升與創新技術路徑分析

朱峰，資格證書編號：S0880522030002

鮑雁辛，資格證書編號：S0880513070005

更多國泰海通研究和服務

亦可聯繫對口銷售獲取

重要提醒

本訂閱號所載內容僅面向國泰海通證券研究服務簽約客戶。因本資料暫時無法設置訪問限制，根據《證券期貨投資者適當性管理辦法》的要求，若您並非國泰海通證券研究服務簽約客戶，爲保證服務質量、控制投資風險，還請取消關注，請勿訂閱、接收或使用本訂閱號中的任何信息。我們對由此給您造成的不便表示誠摯歉意，非常感謝您的理解與配合！如有任何疑問，敬請按照文末聯繫方式與我們聯繫。

法律聲明

本公衆訂閱號(微信號: GTHT RESEARCH )爲國泰海通證券股份有限公司(以下簡稱“國泰海通證券”) 研究所依法設立、獨立運營的唯一官方訂閱號。其他機構或個人在微信平臺上以國泰海通研究所名義註冊的，或含有“國泰海通研究"，或含有與國泰海通證券研究所品牌名稱相關信息的其他訂閱號均不是國泰海通證券研究所官方訂閱號。

本訂閱號不是國泰海通證券研究報告發布平臺，本訂閱號所載內容均來自於國泰海通證券研究所已正式發佈的研究報告，如需瞭解詳細的證券研究信息，請具體參見國泰海通證券研究所發佈的完整報告。

在任何情況下，本訂閱號的內容不構成對任何人的投資建議，國泰海通證券也不對任何人因使用本訂閱號所載任何內容所引致的任何損失負任何責任。

本訂閱號所載內容版權僅爲國泰海通證券所有，國泰海通證券對本訂閱號保留一切法律權利。訂閱人對本訂閱號發佈的所有內容(包括文字、影像等)進行復制、轉載的，需註明出處爲“國泰海通研究”，且不得對本訂閱號所載內容進行任何有悖原意的引用、刪節和修改。

大模型降本增效時代來臨，DeepSeek技術路徑深度剖析

相關資訊