長江證券:豆包UltraMem架構推理成本降低83% AI應用加速落地

事件描述

2025年2月12日,字節跳動豆包大模型團隊提出了全新的稀疏模型架構UltraMem,該架構有效解決了MoE推理時高額的訪存問題,推理速度較MoE架構提升2-6倍,推理成本最高可降低83%。此外,DeepSeek-R1憑藉其優秀的性能以及開源免費的特性在AI平權時代異軍突起,大量廠商紛紛接入DeepSeek模型,其中包括騰訊、百度等大廠以及閱文集團、易點天下、中文在線等企業。

長江證券發表評論:

豆包大模型團隊全新超稀疏架構UltraMem顯著優化推理速度和推理成本。GPT-5時刻有望年內到來。1)UltraMem架構參考PKM架構的設計,針對PKM的3個缺陷予以補充,以實現更高效的訪存、更優質的value檢索,能夠有效解決傳統MoE架構推理時面臨的高額的訪存問題,推理速度較MoE架構提升2-6倍,推理成本最高可降低83%。同時,在性能方面,隨着模型容量的增加,在相同的參數和計算量情況下,UltraMem超過MoE,具有更強的擴展能力,爲更高效和可擴展的語言模型提供了一個有希望的方向。2)GPT-5將“整合大量Open技術”,包括o3,有望年內發佈,並應用於ChatGPT和API。GPT-5將整合語音、畫布、搜索、DeepResearch等功能。ChatGPT的免費版將獲得標準智能設置下對GPT-5的無限制聊天訪問權限。

DeepSeek異軍突起,各家廠商紛紛接入,AI進入平權時代。1)大廠接入DeepSeekR1助力自身產品發展,拓展C端業務。其中,繼ima接入DeepSeek-R1後,騰訊元寶接入滿血版DeepSeek-R1,形成“雙模型+可聯網搜索+整合微信公衆號、視頻號”的產品。同時,微信搜索亦接入DeepSeek-R1當前處於灰度測試階段。此外,騰訊、阿里、百度等大廠紛紛在雲平臺接入DS利於下游廠商開發部署。2)部分廠商接入DeepSeek,用以賦能原有業務。閱文集團宣佈旗下作家輔助創作產品——作家助手集成DeepSeekR1模型,在智能問答、獲取靈感和描寫潤色三方面顯著升級,將提供更智能的創作輔助服務。同時,易點天下也完成DeepSeek-R1私有化部署,將其融入旗下KreadoAI、數眼智能、zMaticoo ADX多款核心產品中。3)中文在線、引力傳媒等公司利用DeepSeek開源模型訓練原有模型。中文在線基於DeepSeek-V3與R1提出的技術路線,研發並訓練升級版“中文逍遙”,以進一步提升該大模型的創作能力。此外,引力傳媒宣佈完成DeepSeek-R1本地化部署,以訓練符合數字營銷和AIGC業務的全新模型。

豆包模型全新超稀疏架構大幅降低推理成本,各廠商紛紛接入開源便宜還好用的DeepSeek-R1,AI應用落地提速進行時。豆包UltraMem架構有望提高AI應用運行速度與響應速度、降低成本以及拓展應用場景。DeepSeek開源模型憑藉其優秀的性能以及開源免費的特性有望顛覆傳統大模型付費訂閱商業模式,各公司間AI產品差異化將更體現在數據&場景。