2025年大廠逆襲!DeepSeek~R1“破圈”助力互聯網行業大變革!

1、 DeepSeek-R1“破圈”拆解:突破性解 決業界難題,全面開源利於傳播

1.1 原因 1:強大性能領跑全球,評測、實際體驗趕超 OpenAI 推理模型o1

DeepSeek 的旗艦推理模型R1 在多個基準測試中的表現超越當下全球 AI行業領 先的推理模型 OpenAI-o1。根據 DeepSeek-R1 公開的技術報告,經過額外的 SFT 階段和進一步的 RL 訓練完善後的 R1,在 AIME 2024、MATH-500、LiveCode Bench、CodeForces 等多個數學、編程測試集中獲得超越 OpenAI 的 o1 系列 的分數 , 僅 在 考 察 物 理 化 學 生 物 的 GPQA Diamond 數 據 集 上 遜 色 於 OpenAI-o1-0912。

DeepSeek-R1 在開發人員和使用者中收穫高評價,其在 Chatbot Arena 榜單中 位居前列,超過 OpenAI-o1。Chatbot Arena 是一個基於人類偏好評估 LLM 的 開放平臺,其方法採用成對比較方法,用戶只需投票比較兩個模型響應並投票選 出更好的一個,平臺通過衆包利用來自不同用戶羣的輸入,截至 2025 年 2 月 9 日,平臺共收集到超過 260 萬次用戶的投票。儘管 DeepSeek-R1 上線時間較晚, 尚未收集到足夠多的投票次數(共 4193 次,前十名的模型中最少),但仍獲得 1361 分的 Arena Elo 分數,超過 OpenAI-o1,僅次於 Gemini 的兩款模型和最 新版的 ChatGPT-4o。

DeepSeek-R1 在實際用戶體驗中收穫不亞於 OpenAI-o1 系列的廣泛好評,包括 英文日常問答、物理測試等。1)海外科技媒體 arstechnica 資深編輯對 DeepSeek-R1 與 OpenAI-o1 和 OpenAI-o1-Pro 進行評測,該評測更側重於模 擬英文用戶可能提出的日常問題,測試中所用的提問涵蓋創意寫作、數學、指令 遵循等領域以及部分設計得更加複雜、要求更高且更嚴謹的提問。該團隊考慮模 型回答的正確性及一些主觀質量因素,最終評測結果 DeepSeek-R1 在多個提問 中返回優於 OpenAI-o1 系列的回覆。2)根據機器之心報道,CoreView CTO Ivan Fioravanti 等海外 AI 社區人士評測稱,DeepSeek-R1 在編寫 Python 腳本,模 擬小球在一個旋轉的形狀中彈跳的物理測試中,收穫優於 OpenAI GPT-4o 等其 他大模型的表現。

1.2 原因 2:多項工作實現算法和工程上的實質性突破, 解決困擾行業的難題

DeepSeek-R1 經歷多代模型的迭代,逐步實現在 GRPO 算法、DeepSeekMoE 架構、MLA 機制、FP8 精度、MTP 方法等多方位的突破。DeepSeek 的首個開 源模型 DeepSeek-Coder,於 2023 年 11 月發佈,當時是業界領先的代碼大模 型。隨後一年多時間,DeepSeek 逐步推出 DeepSeekMath、DeepSeek-V2、 DeepSeek-V3 等多款大模型,不僅提升模型性能,更引入 GRPO 算法、 DeepSeekMoE 架構、MLA 機制、FP8 精度、MTP 方法等多項切實提升模型推 理能力、訓練效率的創新點,並在技術報告中詳細闡述,得到 AI 業界的廣泛討 論和認可。

DeepSeek-R1 是行業首個驗證在後訓練(Post-Training)時使用強化學習(RL) 讓千億參數的模型獲得推理能力的研究,切實解決行業難題。區別於之前業界主 流的探索方向是過程獎勵模型(PRM)和蒙特卡洛樹搜索(MCTS),DeepSeek 跳過指令優化的監督微調(SFT)階段直接用強化學習得到 DeepSeek-R1-Zero 模型,且只採用準確性和格式兩種類型的獎勵,使得模型生成推理軌跡併產生推 理能力。DeepSeek-R1 指出一條除了大幅提升訓練數據量之外獲得效果更好模 型的技術路線。

1.3 原因 3:全面開源並推出免費 C 端產品,使得優質 AI 推理體驗快速擴散

DeepSeek 採用完全開源策略,降低 C 端用戶使用門檻,促進 AI 開發者社區的 協作生態。 相較於閉源且收費較高的 OpenAI-o1,1)通過開源並在技術報告中詳細公佈技 術進展和模型訓練思路,DeepSeek 吸引大量海內外開發者和研究人員的關注, 使得其作爲中國模型首次受到海外 AI 科技界全面推崇認可。2)免費使用的 DeepSeek App 成爲大部分中國乃至全球用戶首次體驗的優質 AI 推理模型,用 戶量實現快速增長。根據 Questmobile 數據,DeepSeek 在 25 年 1 月 28 日的 日活躍用戶數首次超越豆包,隨後在 2 月 1 日突破 3000 萬大關,成爲史上最快 達成這一里程碑的應用。根據 AI 產品榜數據,25 年 1 月 DeepSeek 用戶增長達 1.25 億(含網站(Web)、應用(App)累加不去重)。其中,80%以上用戶 來自 1 月最後一週,即 DeepSeek 在幾乎沒有任何廣告投放情況下實現 7 天完 成 1 億用戶增長。

2、 互聯網大廠大模型:持續迭代參與競爭, 阿里通義性能比肩 DeepSeek

2.1 阿里巴巴: 基座模型、深度推理模型進展穩居第一 梯隊

阿里旗下最新旗艦模型 Qwen2.5-Max 在指令模型、基座模型的指標對比中,均 已能趕超業界領先的模型。阿里通義於 25 年 1 月發佈最新 Qwen2.5-Max 模型, 其爲通義千問系列效果最好的模型。 根據通義千問披露:1)指令模型(即我們平常使用的可以直接對話的模型)對 比,在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基 準測試中,Qwen2.5-Max 的表現超越 DeepSeek-V3。同時在 MMLU-Pro 等其 他評估中也展現出具備競爭力的成績。 2)基座模型對比中,Qwen2.5-Max 在 MMLU(大規模多任務語言理解)、MATH、 BBH 等多項測試中均展現出相對上一代 Qwen2.5-72B 的大幅提升,以及相對 DeepSeek-V3 的超越。 3)儘管並未進一步披露在算法技術、工程上的具體細節,但 Qwen2.5-Max 同 樣爲超大規模的 MoE 模型,使用超過 20 萬億 token 的預訓練數據及精心設計 的後訓練方案進行訓練。Qwen2.5-Max 和 DeepSeek-V3 同樣實現 AI 業界對訓 練超大規模 MoE 模型的突破。

Qwen2.5-Max 代碼編寫等各項能力、實際應用體驗均得到提升,已在 Qwen Chat 中上線,整體接入阿里雲服務 API。1)Qwen2.5-Max 的代碼編寫與理解 能力、邏輯能力、多語言能力顯著提升,回覆風格面向人類偏好進行大幅調整, 模型回覆詳實程度和格式清晰度明顯改善,內容創作、JSON 格式遵循、角色扮 演能力定向提升。2)Qwen2.5-Max 具備聯網搜索功能,輸出的每句話來源出 處都有標註,整體運行也很絲滑。代碼能力上,Qwen2.5-Max 能夠幫助用戶完 成各種可視化創作,一句話生成代碼及建模;也有 Artifacts 功能,一句話能開 發各種小應用、小遊戲。

阿里旗下最新實驗性研究推理模型在數學和編程等領域已取得顯著進步,期待 Qwen2.5-Max 新模型賦能、DeepSeek-R1 開源後的技術啓示,QwQ-32B 正式 版帶來突破。阿里通義於 24 年 11 月發佈 QwQ-32B-Preview 實驗性研究模型, 專注於增強 AI 推理能力。 作 爲 預 覽 版 本 , 根 據 通 義 千 問 披 露 : 1 ) QwQ-32B-Preview 和 OpenAI-o1-preview 和 OpenAI-o1-mini 在 GPQA(科學推理)、AIME、 MATH-500(數學)以及 LiveCodeBench(代碼)四個數據集中各有勝負,但 整體水平比較接近。而相比 GPT-4o、Claude 3.5 Sonnet 和 Qwen2.5,具備比 較明顯的領先優勢。

2)作爲預覽版本,QwQ-32B-Preview 仍存在語言切換問題、推理循環、安全 性考慮和能力差異等問題。而 DeepSeek-R1 已解決部分此侷限性,其多方面能 力超過 OpenAI-o1-mini,在獎勵函數設計中,重點對語言一致性進行的要求。 DeepSeek-R1 的模型訓練思路有望成爲 QwQ-32B 的借鑑,同時在 25 年 2 月發 布的更強大的 Qwen2.5-Max 則有望成爲 QwQ-32B 訓練的基石。

阿里通義同樣是模型開源的支持和踐行者,其在開源大模型中性能和開發者參與 度均居領先位置。1)Qwen 系列模型中,除了旗艦模型閉源商用外,其餘所有 模型都在走開源路線。截至 2025 年 2 月 9 日,Chatbot Arena 排名中, Qwen2.5-72B-Instruct 居第三位,優於 Llama-3.3-70B-Instruct。 2)Qwen 系列的特點是開源模型提供全尺寸開源模型。和 DeepSeek-V3/R1 開 源的 671B 超大模型不同,Qwen 開源模型參數量覆蓋小到手機也能運行的 1.5B,大到 110B,基本上能覆蓋開源社區的絕大多數需求,因而在全球開源社 區中影響力很大,AI 業界非常多的研究工作都是以 Qwen 爲基礎模型開展的。 25 年 2 月 10 日,全球最大 AI 開源社區 Huggingface 發佈了最新的開源大模型 榜單,其中排名前十的開源大模型,都爲基於阿里通義千問開源模型二次訓練的 衍生模型。DeepSeek-R1 基於 Qwen 2.5 模型(參數個數 1.5B 到 32B)蒸餾多 個小模型,提供更具效率的版本,並做案例探索研究。

2.2 騰訊: 基座模型採取跟隨戰略穩健追趕,組織架構 調整聚焦應用結合

騰訊在 AI 大模型中的團隊佈局較爲分散,持續關注人員、資源配置重點。包括: 1)混元大模型團隊,旗下產品包括 23 年 9 月正式上線的混元系列大模型,及 基於混元大模型及搜索引擎驅動的 AI 智能助手“元寶”和 AI 智能體開放平臺“元 器”。 2)騰訊 AI Lab 團隊,早在 16 年 4 月成立,其基礎研究方向包括計算機視覺、 語音技術、自然語言處理和機器學習,應用探索結合了騰訊場景與業務優勢,聚 焦於遊戲、數字人、內容和社交 AI 四類。 3)騰訊雲 AI 團隊,23 年 6 月早於混元發佈行業大模型,併發布面向 B 端客戶 的騰訊雲 MaaS 服務解決方案,騰訊雲板塊基礎設施持續支持騰訊內部模型研發 和應用探索。 4)其他應用團隊,騰訊內每個事業羣內均在探索大模型的產品化落地場景,包 括微信、QQ、輸入法、瀏覽器等產品都將推出 AI 智能體,遊戲、微信讀書、騰 訊視頻等產品也將基於混元做更多 AI 探索。以微信 AI 團隊爲例,24M1 微信公 開課 PRO 分享微信對話開放平臺的更新,其能夠幫助開發者和商家快速搭建一 個零成本、低門檻,滿足自身業務需要的對話機器人。

組織架構調整,元寶併入 CSIG,或彰顯騰訊 AI 戰略更加清晰,從技術到重視產 品體驗,從“後手入場”到全面探索 AI 應用的轉變。25 年初,騰訊 AI 助手應 用“元寶”完成組織調整,產品團隊從 TEG 事業羣(技術工程事業羣)調整至 CSIG(雲與智慧產業事業羣)。調整後,“元寶”應用將交由騰訊會議負責人 吳祖榕負責,主要負責元寶的產品能力建設和體驗優化。 我們認爲:1)元寶從技術部門的剝離或顯示出騰訊 AI 戰略從技術到重視產品體 驗的轉變。吳祖榕是一個具有豐富 ToB 經驗且能兼顧 C 端產品體驗的負責人, 元寶有望複製騰訊會議經驗,以 C 端體驗爲入口,連接和服務企業客戶,進而 探索 AI 商業化。騰訊會議基於混元大模型已經推出智能錄製、智能生成摘要總 結、騰訊會議 AI 助手等功能。 2)元寶 App 等騰訊 AI 產品 24 年整體進展相對保守,後續或有望在 AI 產品化 方面轉向積極。騰訊公司一貫更注重長期維持優質的產品設計和用戶體驗,通常 謹慎對待新技術新概念融入自身產品矩陣和社交體系,在元寶 App 的推廣方面 較爲保守。根據 Questmobile 數據,24 年 12 月騰訊元寶 App MAU 211 萬,明 顯低於字節豆包 App、百度文小言 App 等。根據第一財經等媒體報道,25 年 1 月騰訊集團年會中,董事會主席兼 CEO 馬化騰表示,期望做騰訊混元的端到端 語音交互落地。TEG 進行架構調整,將更聚焦做技術底座,產品化則希望其他事業羣一起推進。騰訊混元已經在跟騰訊會議、輸入法、瀏覽器等結合,微信、 QQ 都在推進智能體落地了,遊戲也要全方位擁抱 AI。

基礎大模型方面,騰訊混元最新開源 Hunyuan-Large 模型,模型效果整體趕超 Llama3.1-405B 及 DeepSeek-V2.5。根據混元披露:1)騰訊混元 24 年 11 月 發佈的 Hunyuan-Large(Hunyuan-MoE-A52B)模型,是當時業界已經開源的 基於 Transformer 的最大 MoE 模型,擁有 389B 總參數和 52B 激活參數(對比 DeepSeek-V3 總參數量 671B,每個 Token 激活的參數量爲 37B)。2) Hunyuan-Large 在 CMMLU、MMLU、CEval、MATH 等多學科綜合評測集以及 中英文 NLP 任務、代碼和數學等維度取得理想成績,在 MMLU、MATH、 HumanEval 超 越 Llama3.1-405B 及 DeepSeek-V2.5 , 在 ARC-C 、 GPQA_diamond 不如 Llama3.1-405B,BBH、HellaSwag 不如 DeepSeek-V2.5, 整體成績略好於這兩個當時領先的開源模型。

騰訊混元在多模態方面具有較廣佈局和較多進展,探索 3D 生成、文生視頻等領 域,爲內部賦能和行業進步打下基礎。 1)25 年 1 月,騰訊開源 3D 生成大模型 2.0 升級版本,上線業界首個一站式 3D 內容 AI 創作平臺——混元 3D AI 創作引擎。作爲創作者,可以用它輸入文字、圖片一鍵生成高質量 3D 模型,幷包含 3D 功能矩陣、3D 編輯、3D 生成工作流、 創作素材庫等多種功能。作爲遊戲開發、動畫製作等領域專業創作者,還支持快 速搭建 3D 生成工作流。

混元 3D AI 模型 2.0 版本再升級,通過幾何、紋理解耦生成,幾何結構更精細, 紋理色彩更豐富。幾何模型實現超高精度白模生成,媲美設計師手工建模水平。 紋理模型則能對任意幾何模型生成逼真紋理,支持文本/圖像引導。

2)24 年 12 月,騰訊宣佈旗下混元視頻生成大模型(HunYuan-Video)開源, 模型參數量 130 億。該模型可供企業與個人開發者免費使用,目前已上線騰訊 元寶 APP。HunYuan-Video 在文生視頻多個方面都具有較高的質量,擁有包括 超寫實畫質、原生鏡頭切換、高語義一致等特點。

2.3 百度:文心最早上線經多次迭代,期待 25 年下一代 模型能力提升

百度自率先發布國產大模型文心以來,推出多次大模型迭代及相關產品發佈,期 待 25 年文心新版本面世。24 年 6 月,百度發佈文心大模型 4.0 Turbo,大幅強 化檢索能力以改善幻覺問題,全網搜索、分析資料、等待大模型回覆的速度得到 明顯提升。24 年 11 月,百度集團 CEO 李彥宏稱文心的新版本面世,或在 25 年年初。 百度通過兩大關鍵產品:大模型精調和應用開發平臺的千帆,以及提供穩定高效 算力服務的百舸平臺,爲企業提供全棧服務解決方案。1)百舸:以 GPU 爲核 心搭建的異構計算平臺,適合多模態大模型訓練。百舸平臺支持同一智算集羣中 混合使用不同廠商芯片,降低算力成本的同時,多芯混合訓練任務的性能損失, 控制在了萬卡性能損失 5%,已經是業界最高水平。2)千帆:主打低門檻的模 型平臺,憑藉模型開發層、模型服務層和應用開發層三層架構,滿足多樣化的現 實需求。在模型開發層,千帆提供全流程工具;在模型服務層,可直接調用多模 態能力;在應用開發層,千帆幫助企業用多模態能力改造業務。

2.4 快手: 可靈模型專注文生視頻領域居業界領先

快手旗下文生視頻生成模型可靈始終處於全球業界領先水平,最新基座版本更新 後,帶來顯著畫面表現力提升,並獲得專家評測榜單好評。 1)可靈在上線半年多的時間保持積極的前沿探索和模型更新,維持全球視頻生 成領域領先水平。可靈 24 年 6 月正式發佈並上線,作爲全球首個可公開體驗的真實影像級視頻生成大模型,截至 25 年 1 月,可靈已完成數十次功能與效果的 升級迭代,同時陸續推出多項豐富且實用的控制與編輯功能。 2)可靈 1.6 視頻生成模型文本響應度、畫面美感及運動合理性,均有明顯提升, 圖生視頻更新效果提升明顯。24 年 12 月,可靈 AI 宣佈基座模型再升級,同時 支持標準和高品質模式,特別是 1.6 模型的圖生視頻,內部評測比 1.5 模型整 體效果提升 195%,模型物理規律真實感、語義理解得到提升,人物運動表演更 強。

3)可靈文生視頻模型在 AGI-Eval 榜單評測中居前列,超過 OpenAI 的 Sora 模 型,得分接近國產 Pixverse-V3 模型。AGI-Eval 通過構建上百條評測數據和專家 級人工評測團隊,對 Sora 、及國產頭部視頻生成模型進行專業評測。可靈 1.5 的文生視頻模型在 24 年 12 月的最新測評中拿到 0.573 分,拿到第二名,高於 OpenAI 的 Sora-720p 和 Sora-1080p,僅略低於 Pixverse-V3 的 0.5732 分。 具體評價上看,與國內頭部大模型(國內前三)相比,Sora 在視頻-文本一致性 維度、視頻質量上均有小幅落後。Sora 在運動質量維度表現略好於可靈 1.6,即 生成的視頻畫面在動態過程中的主體一致性和動態幅度更自然。在視頻-文本一 致性維度上,Sora 存在文本理解有誤、指令遵循不符的問題,即生成的視頻內 容與提示詞的描述不符的現象。

2.5 美團: MobileVLM V2 模型在移動設備環境具備優 勢,或仍在推進自研模型

美團聯合學術界推出 MobileVLM V2 模型,有望在保持較小規模同時達到優質性 能,在移動設備等環境展現優勢。24 年 2 月,美團公司聯合浙江大學和大連理 工的研究人員共同開發的視覺語言模型 MobileVLM V2 發佈。這一模型系列在保 持較小模型規模的同時,達到了與更大規模 VLMs 相媲美甚至更優的性能,尤其 在移動設備等資源受限的環境中展現出其獨特的優勢。 1)MobileVLM V2 在前代 MobileVLM 的基礎上,通過精心設計的架構優化、 改進的訓練策略,以及對高質量數據集的細緻策劃,實現顯著的性能提升。 2)MobileVLM 具備在移動端運行推理的能力。其在高通驍龍 888 CPU 和英偉 達 Jetson Orin GPU 上測量推理速度,分別獲得 21.5 個 Token 和 65.3 個 Token 每秒的 state-of-the-art 性能。

美團自研大模型仍未公佈名稱等細節,內部或仍在推進大模型研發及摸索業務結 合方向。23 年 11 月,在國內第二批通過備案的 11 家公司大模型裡包含美團, 但美團並未公佈其大模型的名稱、定位及應用案例等,整體美團在大模型的研發 和投入比較隱秘。根據鈦媒體消息,23 年美團已在擴張算法團隊,並啓動籌劃 單獨的“平臺部門”,幫助美團大模型通過具體的商業化形式落地。我們認爲, 美團或仍在探索大模型如何更緊密得和自身業務相結合,建議關注後續 AI 對美 團內部工作提效的應用,及對美團更多業務場景的滲透。

2.6 嗶哩嗶哩: Index 自研模型在角色扮演、長文本等 方面表現不俗

嗶哩嗶哩推出自研 Index 模型,在對話交互、角色扮演等方面展現出較爲出色 的性能。 1)Index 系列包含聊天、角色扮演等多個模型,向輕量級探索的同時,覆蓋方 向較爲全面。24 年 6 月,嗶哩嗶哩發佈 Index 系列模型中的輕量版本:Index-1.9B 系列,其中包含基座模型:多個評測基準上與同級別模型比處於領先;基座模型 對照組;增強聊天趣味性的 Index-1.9B chat;實現 fewshots 角色扮演定製的 Index-1.9B character。24 年 9 月,嗶哩嗶哩開源長文本處理能力出色的 Index-1.9B-32K。 2)嗶哩嗶哩 Index-70B 模型在角色扮演能力方面具備出色能力,符合嗶哩嗶哩 自身潛在應用場景。根據 24 年 11 月在中文場景角色扮演評測集 benchmark CharacterEval 上的測試,Index-70B 角色扮演模型在該 benchmark 中均分第 一,且在知識幻覺性、對話流利度、表現多樣性 12 個細分維度中的 7 項中排名 第一,優於情感陪伴賽道同類產品。對於 B 站來說,角色扮演模型在娛樂、教 育、視頻創作等方面都擁有着豐富的應用場景。 3)嗶哩嗶哩 Index 模型已經應用於自身 AI 字幕等場景,期待後續模型在對 AI 接受度更高的年輕人社區得到更廣泛的應用。24 年 9 月嗶哩嗶哩 CEO 陳睿表示, B 站將自研大語言模型 index 應用於 AI 字幕,具備中、英、韓、日、泰語等 近 10 種語言的實時翻譯能力,準確度接近 90%。

3、 DeepSeek“破圈”後,對互聯網大廠 AI 應用有何價值?

3.1 大模型能力:R1 是起點不是終點,技術突破有望啓 發大廠改進模型

DeepSeek-R1 只是 DeepSeek 的第一個推理模型,其帶來的突破有機會在後續 研發中持續完善,在近期帶來性能更強力的產品。DeepSeek-R1 證明僅用強化 學習就可以在後訓練階段提升模型推理能力,後續通過在此階段增加算力,有望 滿足後訓練階段的強化學習 Scaling Law(RL Scaling Law),進而提升大模型的 效率。

DeepSeek-R1 的研究過程已經證明對阿里 Qwen2.5 進行微調,能夠提升模型 能力, DeepSeek-R1 的 模 式 有 助 於 激 發 現 有 模 型 潛 力 。 蒸餾後的 DeepSeek-R1-Distill-Qwen-32B 模型各評測指標儘管不如 DeepSeek-R1 但好 於參數量級高很多的 DeepSeek-R1-Zero,也好於通義千問自己的推理模型 QwQ-32B-Preview。蒸餾後的較小模型有較低的運行成本,有利於推理模型的 推廣。

DeepSeek 的成功可能會加劇 AI 大模型的前沿競爭,或有望促使各大互聯網公 司加大對 AI 大模型的戰略投入。我們認爲:1)DeepSeek-R1 的成功表明,在 核心技術上取得實質性突破,能夠收穫業界廣泛好評和用戶的積極參與。騰訊、 阿里等國內互聯網大廠或將持續加大在 AI 算法、模型架構和訓練方法上的研發 投入。2)DeepSeek-R1 的成功是長期技術研發積累的結果,建議關注騰訊、阿 裡等國內互聯網大廠短期市場表現和用戶規模的同時,也重點關注其長期技術積 累和戰略佈局。 DeepSeek 的多項創新性技術突破路徑已開源,其或可被複刻至各大互聯網公司 旗 下 AI 模型 中 ,帶 來模 型 能 力的 提升 。 正如 2.1 節 中所 敘述 ,阿 裡 QwQ-32B-Preview 存在的語言切換問題已被 DeepSeek-R1 部分解決,在獎勵 函數設計中,重點對語言一致性進行的要求,DeepSeek-R1 的模型訓練思路有 望成爲 QwQ-32B 的借鑑。DeepSeek-R1 在後訓練階段使用 RL 的方法和 GRPO 算法、DeepSeekMoE 架構、MLA 機制、FP8 精度、MTP 方法等均可爲行業所 參考並用於提升自身模型能力。DeepSeek 驅動模型能力提升,有望進一步加強 互聯網大廠模型對內業務賦能、對外商業化輸出的能力。

3.2 雲服務: 大廠已廣泛支持 DeepSeek 模型,模型加 速迭代有望提升雲需求

DeepSeek 的成功證明海內外市場對高性能 AI 推理的強烈需求。 1)DeepSeek 服務器不足以長期滿足大用戶量使用,雲廠商具備計算資源可供 使用。由於 DeepSeek-R1 新模型發佈後,用戶訪問量激增,DeepSeek 服務器 無法滿足大量用戶的併發需求,25 年 2 月 6 日起 DeepSeek 已暫停 API 服務充 值。 2)DeepSeek 採用寬泛、自由的 MIT 開源許可證,其一方面允許商用,使得雲 廠商可較爲便捷地將其上線提供服務,另一方面允許修改調整模型,開源模型有 望在後續得到快速迭代,進而得到可觀的進步,爲後續雲廠商上線更多優質開源 模型、提供多種模型供用戶選擇提供可能性。 3)DeepSeek-R1 受到廣泛好評後,已經有多家互聯網大廠接入 DeepSeek,開始在自己的雲平臺提供 DeepSeek-R1 調用或部署服務。2 月 2 日以來,騰訊雲、 阿里雲、百度智能雲等互聯網雲服務紛紛支持調用 DeepSeek-R1 模型,部分廠 商提供價格優惠,如百度智能雲千帆平臺推出超低價格方案,調用 R1 輸入 2 元 /百萬 token、輸出 8 元/百萬 token,還可享受限時免費服務。

我們認爲,各大互聯網公司: 1)可通過云爲用戶提供 DeepSeek 服務,從而提升自身雲服務付費用戶量並實 現雲服務收入增長。 2)有望伴隨着 DeepSeek 的火熱,使得市場感知到並認可頭部互聯網公司雲服 務能力和未來增長空間,有望逐步提升雲業務估值水平。 具有更便捷的接入方式、更廣泛的客戶羣體、更強的技術穩定性的雲服務廠商有 望率先受益。

3.3 AI Agent:優質推理模型帶來能力提升,大廠 AI Agent&行業應用有望滲透

DeepSeek-R1 的推理能力和思維鏈能夠直接賦能 AI Agent,爲其提供一定程度 自主性和複雜推理能力,助力 AI Agent 逐步完善。1)作爲優質的推理模型, DeepSeek 無需複雜提示詞即可理解用戶意圖,有望降低 AI Agent 的使用門檻, 提升人機交互的自然性。2)由於 AI Agent 會自主規劃任務,token 消耗相對不 可控,DeepSeek 旗下旗艦模型在擁有業界領先性能的同時,實現顯著的成本降 低,有望助力維持 AI Agent 成本的相對可控。3)DeepSeek 旗下旗艦模型均開 源,使得擁有應用場景的企業或機構更容易應用 DeepSeek 模型開發適合自身 垂類領域的 AI Agent,進而使得 AI Agent 逐步被認知、被應用。

OpenAI 已上線其 AI Agent,騰訊、阿里等互聯網大廠已提供 AI Agent 服務。1) ChatGPT 25M1 更新新功能“Tasks”,讓 AI 具備一定執行力,可以替用戶完 成各種任務,如定時提醒天氣、總結&創作文章、創建編程謎題等。2)百度文 心智能體平臺、騰訊元器、訊飛星火智能體創作中心、通義智能體、字節釦子等 面向企業用戶提供了智能體創建平臺,並開始在其 AI 智能助手界面中添加 AI Agent 入口。 AI Agent 仍處於發展早期,具備一定不可預測性,且依賴基座模型表現, DeepSeek-R1 有望帶來提升。1)AI Agent 工作流程需鏈接多個 AI 步驟,用戶 難以確保 Agent 能否始終提供準確、符合上下文的響應。2)AI Agent 依賴基座 模型需要具備較快的速度和較低的成本,特別是需要進行循環和自動重試時。

3.4 AI+廣告: AIGC 重塑營銷鏈條,更強的模型效果提 升廣告自動化能力

海外互聯網大廠已經在廣告主側(B 端)和消費者側(C 端)全面重塑營銷鏈條, 從而提升廣告投放效率和增加廣告創收。 1)B 端: 過去依賴人工經驗和傳統計算的營銷決策,正在被具備高度數據理性的 AI 系統 所取代。微軟廣告的動態搜索廣告(DSA)系統會自動爲每一個落地頁動態創建 廣告,並基於 AI 驅動自動識別搜索與對話背後的用戶意圖,從而更高效地和商 家廣告精準匹配,最終達成獲客成本的下降和投資回報率的提升。Meta 基於 AI驅動的自動化廣告產品 Advantage+已經讓 Meta 的廣告收入實現連續的強勁 增長。 2)C 端:在 AI 生成內容中創新性地引入廣告,在廣告組件中的交互中運用生成 式 AI。 23 年穀歌就將廣告引入到對話型 AI 產品中,24 年更進一步,AI 生成的搜索結 果概要(Overviews)就成爲一個重要的廣告位置,其圖像識別工具 Lens 中推 出購物廣告,目標是吸引更多電商類客戶投放廣告。AI 對於廣告承載頁的交互 方面,用戶在谷歌搜索裝修和傢俱購買時,谷歌會允許用戶提交一系列客廳照片, 然後智能地向他們推薦適合用戶目標房間的相關傢俱。

國內互聯網大廠已有 AI+廣告投放方面、AI+廣告素材生成方面佈局,DeepSeek 系列旗艦模型在提升性能的同時全面開源,有望助力互聯網大廠進一步增強自動 化廣告投放能力。 1)對於百度,24 年 12 月百度商業系統升級爲“百度伴飛”,基於文心大模型, 整合多樣化的 AI 能力,助力實現高品質品牌宣傳,並帶來視頻廣告點擊率、完 播率等投放效果提升。 2)對於騰訊,騰訊廣告妙思由騰訊混元大模型提供基底支持,通過其對語義的 精準理解和表達,生產穩定實用的廣告創意素材,降低廣告優化師製作廣告的成 本。 3)對於嗶哩嗶哩,25 年 1 月推出首個商業化 AIGC 平臺“星辰 AI”, 能夠智 能化地生成圖片素材,同時優化廣告創意的迭代過程,有望提高廣告素材的轉化 率。

我們認爲,廣告作爲高毛利業務板塊,AI 賦能空間理想。騰訊等國內互聯網公 司此前在 AI+廣告賦能領域相較於海外大廠較慢,部分因模型性能等 AI 技術能 力相較海外領先水平有一定差距,且應用 AI 賦能廣告的實踐晚於海外大廠。 若借力 DeepSeek 等高性能模型帶來的模型水平提升,有望伴隨着 AI 廣告的應 用實踐,逐步加深 AI 自動化廣告的滲透,將大模型更深度地用於分析用戶在自 身生態上的行爲,精準總結畫像進而優化廣告定向投放,促進廣告點擊率等指標 增長,進而提升廣告業務收入和利潤水平的增長率。25 年 1 月騰訊集團年會中, 董事會主席兼 CEO 馬化騰表示,看好 AI 未來給廣告帶來的空間。

(本文僅供參考,不代表我們的任何投資建議。如需使用相關信息,請參閱報告原文。)