☰

國聯民生證券：豆包推出UltraMem架構推動端側AI快速發展

國聯民生證券發表研究報告稱：

豆包提出全新稀疏架構

近期，字節跳動豆包大模型團隊提出了全新的稀疏模型架構UltraMem。該架構有效解決了MoE推理時高額的訪存問題，推理速度較MoE架構提升2-6倍，推理成本最高可降低83%。研究還揭示了新架構的ScalingLaw，證明其不僅具備優異的Scaling特性，更在性能上超越了MoE。實驗結果表明，訓練規模達2000萬value的UltraMem模型，在同等計算資源下，可同時實現業界領先的推理速度和模型性能，爲構建數十億規模value或expert開闢了新路徑。

大模型內嵌操作系統助力AI手機發展

中興努比亞手機率先將大模型內嵌到操作系統中，後續其他廠商有望跟進。中興努比亞星雲AI率先實現全尺寸內嵌DeepSeek-R1，並在努比亞Z70Ultra機型正式上線，可以發揮以下優勢。（1）努比亞Z70Ultra可在星雲智能對話界面直接調用DeepSeek-R1，避免多入口帶來的繁雜操作。（2）DeepSeek-R1實現了與努比亞Z70Ultra星雲AI多模態能力的無縫交互。（3）全尺寸內嵌DeepSeek-R1也可與努比亞AI耳機等智能設備互聯，用戶可通過耳機直接語音喚醒DeepSeek。

國內模組廠商爭相支持DeepSeek模型

美格智能推出AIMO智能體產品，並加速開發DeepSeek-R1模型在端側落地應用及端雲結合整體方案。移遠通信在邊緣計算模組SG885G上成功實現了DeepSeek-R1蒸餾小模型的穩定運行，其生成Tokens的速度超過每秒40個Tokens，且未來隨着性能的不斷優化，速度還將進一步提升。廣和通高算力AI模組及解決方案已全面支持小尺寸的DeepSeek-R1模型。未來有望在自動駕駛、機器人控制、智能製造、智慧醫療、AI智能體等場景廣泛應用。

DeepSeek-R1模型的成功發佈，豆包提出全新的稀疏模型架構UltraMem，這都有望降低推理側模型的成本，助力模型在端側的部署續提升。

國聯民生證券：豆包推出UltraMem架構推動端側AI快速發展

相關資訊