☰

字節跳動豆包大模型團隊開源一項MoE架構優化技術

字節跳動豆包大模型團隊近日開源一項名爲COMET的MoE架構優化技術，可將大模型訓練效率提升1.7倍。論文顯示，該技術已實際應用於字節的萬卡集羣訓練，實現數百萬GPU小時訓練算力的節省。

相關資訊

▣ 字節豆包大模型團隊提出稀疏模型架構UltraMem
▣ 字節豆包大模型團隊提出稀疏模型架構推理成本最高可降低83%
▣ 字節開源MoE關鍵優化技術，模型訓練成本省40%、內部萬卡集羣已部署
▣ 字節跳動商業化團隊模型訓練被“投毒” 內部人士稱未影響豆包大模型
▣ 字節跳動：豆包大模型團隊前員工嚴重違反制度，已辭退
▣ 字節跳動全量開放豆包即時語音大模型
▣ 字節跳動商業化團隊模型訓練被“投毒”，內部人士稱豆包大模型未受攻擊影響
▣ 豆包大模型團隊開源視頻生成模型VideoWorld
▣ 社交媒體X頻繁宕機，馬斯克稱遭遇大規模網絡攻擊；字節開源MoE架構優化技術，訓練成本省40%丨全球科技早參
▣ 字節跳動豆包大模型下週將發佈視頻生成模型
▣ 字節跳動豆包大模型支持實時語音通話
▣ 字節跳動發佈豆包大模型1.5Pro，強調獨立的訓練數據來源
▣ 字節跳動豆包大模型降價後毛利率仍達50%
▣ 字節跳動發佈豆包大模型，稱主力模型比行業便宜低99.3%
▣ 字節跳動開源一款 Deep Research 項目
▣ 影響市場大事件：宇樹科技兩款人形機器人京東線上剛上架就下架；字節豆包大模型團隊提出稀疏模型架構，推理成本最高可降低83%
▣ “小愛同學”接入字節跳動豆包大模型，小米 SU7 已搭載
▣ 接入豆包大模型字節跳動首款AI智能體耳機來了！
▣ 字節跳動發佈豆包大模型 1.5 Pro，綜合性能超越GPT-4o
▣ 字節跳動Seed開源VeOmni框架
▣ 傳字節跳動秘密利用OpenAI技術打造自家大模型
陸字節跳動豆包大模型成中國最受歡迎AI聊天機器人
▣ 豆包大模型團隊&港大提出新成果ByteCheckpoint，性能最高優化529.22倍
▣ AI早知道｜豆包團隊開源SuperGPQA；智譜發佈開源圖像生成模型
▣ 字節跳動Seed團隊發佈端到端同聲傳譯模型
▣ 字節大模型團隊架構調整吳永輝、朱文佳都向樑汝波彙報
▣ 字節跳動與北京大學成立“豆包大模型系統軟件聯合實驗室”
▣ 昇騰原生，華爲發佈準萬億模型Pangu Ultra MoE模型架構和訓練細節
▣ AI應用觀察：DeepSeek開源降本；字節跳動豆包用戶躍升

DMCA | PRIVACY | s@bg3.co