字節豆包大模型團隊提出稀疏模型架構UltraMem

據豆包大模型團隊消息，字節跳動豆包大模型Foundation團隊近期提出UltraMem，一種同樣將計算和參數解耦的稀疏模型架構，在保證模型效果的前提下解決了推理的訪存問題。據介紹，該架構有效解決了MoE推理時高額的訪存問題，推理速度較MoE架構提升2-6倍，推理成本最高可降低83%。

本文源自：金融界AI電報

相關資訊