國聯民生證券:豆包推出UltraMem架構推動端側AI快速發展
國聯民生證券發表研究報告稱:
豆包提出全新稀疏架構
近期,字節跳動豆包大模型團隊提出了全新的稀疏模型架構UltraMem。該架構有效解決了MoE推理時高額的訪存問題,推理速度較MoE架構提升2-6倍,推理成本最高可降低83%。研究還揭示了新架構的ScalingLaw,證明其不僅具備優異的Scaling特性,更在性能上超越了MoE。實驗結果表明,訓練規模達2000萬value的UltraMem模型,在同等計算資源下,可同時實現業界領先的推理速度和模型性能,爲構建數十億規模value或expert開闢了新路徑。
大模型內嵌操作系統助力AI手機發展
中興努比亞手機率先將大模型內嵌到操作系統中,後續其他廠商有望跟進。中興努比亞星雲AI率先實現全尺寸內嵌DeepSeek-R1,並在努比亞Z70Ultra機型正式上線,可以發揮以下優勢。(1)努比亞Z70Ultra可在星雲智能對話界面直接調用DeepSeek-R1,避免多入口帶來的繁雜操作。(2)DeepSeek-R1實現了與努比亞Z70Ultra星雲AI多模態能力的無縫交互。(3)全尺寸內嵌DeepSeek-R1也可與努比亞AI耳機等智能設備互聯,用戶可通過耳機直接語音喚醒DeepSeek。
國內模組廠商爭相支持DeepSeek模型
美格智能推出AIMO智能體產品,並加速開發DeepSeek-R1模型在端側落地應用及端雲結合整體方案。移遠通信在邊緣計算模組SG885G上成功實現了DeepSeek-R1蒸餾小模型的穩定運行,其生成Tokens的速度超過每秒40個Tokens,且未來隨着性能的不斷優化,速度還將進一步提升。廣和通高算力AI模組及解決方案已全面支持小尺寸的DeepSeek-R1模型。未來有望在自動駕駛、機器人控制、智能製造、智慧醫療、AI智能體等場景廣泛應用。
DeepSeek-R1模型的成功發佈,豆包提出全新的稀疏模型架構UltraMem,這都有望降低推理側模型的成本,助力模型在端側的部署續提升。