☰

豆包提出全新稀疏架構推理成本較MoE最高可降83%

證券時報e公司訊，隨着模型規模的擴大，推理成本和訪存效率已成爲限制大模型規模應用的關鍵瓶頸。近期，字節跳動豆包大模型團隊提出了全新的稀疏模型架構UltraMem，該架構有效解決了MoE推理時高額的訪存問題，推理速度較MoE架構提升2—6倍，推理成本最高可降低83%。該研究還揭示了新架構的Scaling Law，證明其不僅具備優異的Scaling特性，更在性能上超越了MoE。實驗結果表明，訓練規模達2000萬value的UltraMem模型，在同等計算資源下，可同時實現業界領先的推理速度和模型性能，爲構建數十億規模value或expert開闢了新路徑。

相關資訊

▣ 字節豆包大模型團隊提出稀疏模型架構推理成本最高可降低83%
▣ 影響市場大事件：宇樹科技兩款人形機器人京東線上剛上架就下架；字節豆包大模型團隊提出稀疏模型架構，推理成本最高可降低83%
字節跳動旗下「豆包」新模型架構推理成本最多降83%
▣ 長江證券：豆包UltraMem架構推理成本降低83% AI應用加速落地
▣ 字節豆包大模型團隊提出稀疏模型架構UltraMem
▣ 雲計算滬港深ETF（517390）收漲3.68%，漢得信息漲停，豆包提出全新稀疏架構
▣ 顏水成袁粒提出新一代MoE架構：專家吞吐速度最高提升2.1倍！
▣ 盤前有料丨豆包提出新架構，大幅降低推理成本；廣東省省長與馬化騰交流……重要消息還有這些
▣ 利亞德：推進改革、加大技術創新、優化管理架構、降低成本、提高效率
▣ 新鮮早科技丨任正非會見一衆科技廠商高管；OpenAI計劃在未來幾周內發佈GPT-4.5模型；豆包大模型推理成本最高可降低83%；
▣ 字節跳動豆包大模型團隊開源一項MoE架構優化技術
▣ 稀宇科技推出萬億MoE模型abab 6.5
▣ 國聯民生證券：豆包推出UltraMem架構推動端側AI快速發展
NVIDIA推出首款採用全新Maxwell架構圖形處理器
▣ CEVA推出邊緣設備新款AI推理處理器架構
NVIDIA推出兩款全新Kepler架構GPU
▣ 豆包大模型團隊&港大提出新成果ByteCheckpoint，性能最高優化529.22倍
安謀推出Armv9新架構主打安全性
▣ 將多模態大模型稀疏化，3B模型MoE-LLaVA媲美LLaVA-1.5-7B
▣ 譚待迴應豆包模型“卷”價格：技術創新降低成本，推動AI普惠
▣ 第一個100%開源的MoE大模型，7B的參數，1B的推理成本
▣ 無問芯穹提出混合稀疏注意力方案MoA，實現最高8倍吞吐率提升
▣ OpenAI推出全新o3-mini推理模型，並提供免費ChatGPT版本
▣ AI早知道｜豆包App推出新語音模式；可靈「多圖參考」功能全新上線內首個輸出分步式講解的推理模型
「瀏海」比較貴！市調機構估計全熒幕手機成本高2成
▣ 字節對MoE模型訓練成本再砍一刀成本可節省40%
WTO：AI降成本增生產力可望提高全球貿易價值近40%
▣ 新規出爐保險代理人頂層設計架構成型
▣ 北京君正：公司沒有開發MOE架構計算芯片

DMCA | PRIVACY | s@bg3.co

豆包提出全新稀疏架構 推理成本較MoE最高可降83%

相關資訊

豆包提出全新稀疏架構推理成本較MoE最高可降83%