字節豆包大模型團隊提出稀疏模型架構推理成本最高可降低83%

《科創板日報》12日訊，據豆包大模型團隊消息，字節跳動豆包大模型Foundation團隊近期提出UltraMem，一種同樣將計算和參數解耦的稀疏模型架構，在保證模型效果的前提下解決了推理的訪存問題。據介紹，該架構有效解決了MoE推理時高額的訪存問題，推理速度較MoE架構提升2-6倍，推理成本最高可降低83%。

字節豆包大模型團隊提出稀疏模型架構 推理成本最高可降低83%

相關資訊

字節豆包大模型團隊提出稀疏模型架構推理成本最高可降低83%