豆包提出全新稀疏架構 推理成本較MoE最高可降83%
證券時報e公司訊,隨着模型規模的擴大,推理成本和訪存效率已成爲限制大模型規模應用的關鍵瓶頸。近期,字節跳動豆包大模型團隊提出了全新的稀疏模型架構UltraMem,該架構有效解決了MoE推理時高額的訪存問題,推理速度較MoE架構提升2—6倍,推理成本最高可降低83%。該研究還揭示了新架構的Scaling Law,證明其不僅具備優異的Scaling特性,更在性能上超越了MoE。實驗結果表明,訓練規模達2000萬value的UltraMem模型,在同等計算資源下,可同時實現業界領先的推理速度和模型性能,爲構建數十億規模value或expert開闢了新路徑。
相關資訊
- ▣ 字節豆包大模型團隊提出稀疏模型架構 推理成本最高可降低83%
- ▣ 影響市場大事件:宇樹科技兩款人形機器人京東線上剛上架就下架;字節豆包大模型團隊提出稀疏模型架構,推理成本最高可降低83%
- 字節跳動旗下「豆包」新模型架構 推理成本最多降83%
- ▣ 長江證券:豆包UltraMem架構推理成本降低83% AI應用加速落地
- ▣ 字節豆包大模型團隊提出稀疏模型架構UltraMem
- ▣ 雲計算滬港深ETF(517390)收漲3.68%,漢得信息漲停,豆包提出全新稀疏架構
- ▣ 顏水成袁粒提出新一代MoE架構:專家吞吐速度最高提升2.1倍!
- ▣ 盤前有料丨豆包提出新架構,大幅降低推理成本;廣東省省長與馬化騰交流……重要消息還有這些
- ▣ 利亞德:推進改革、加大技術創新、優化管理架構、降低成本、提高效率
- ▣ 新鮮早科技丨任正非會見一衆科技廠商高管;OpenAI計劃在未來幾周內發佈GPT-4.5模型;豆包大模型推理成本最高可降低83%;
- ▣ 字節跳動豆包大模型團隊開源一項MoE架構優化技術
- ▣ 稀宇科技推出萬億MoE模型abab 6.5
- ▣ 國聯民生證券:豆包推出UltraMem架構推動端側AI快速發展
- NVIDIA推出首款採用全新Maxwell架構圖形處理器
- ▣ CEVA推出邊緣設備新款AI推理處理器架構
- NVIDIA推出兩款全新Kepler架構GPU
- ▣ 豆包大模型團隊&港大提出新成果ByteCheckpoint,性能最高優化529.22倍
- ▣ 將多模態大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B
- 安謀推出Armv9新架構 主打安全性
- ▣ 第一個100%開源的MoE大模型,7B的參數,1B的推理成本
- ▣ 無問芯穹提出混合稀疏注意力方案MoA,實現最高8倍吞吐率提升
- ▣ OpenAI推出全新o3-mini推理模型,並提供免費ChatGPT版本
- 「瀏海」比較貴!市調機構估計全熒幕手機成本高2成
- ▣ AI早知道|豆包App推出新語音模式;可靈「多圖參考」功能全新上線內首個輸出分步式講解的推理模型
- ▣ 字節對MoE模型訓練成本再砍一刀 成本可節省40%
- ▣ 新規出爐 保險代理人頂層設計架構成型
- ▣ 北京君正:公司沒有開發MOE架構計算芯片
- ▣ 國家區塊鏈技術創新中心推出“菩提”硬件架構
- ▣ NVIDIA 推出適用於小型 LLM 的全新混合架構 Hymba