☰

華爲：昇騰AI計算平臺訓練出準萬億MoE模型

5月30日消息，華爲宣佈推出參數規模高達7180億的全新模型盤古Ultra MoE，這是一個全流程在昇騰AI計算平臺上訓練的準萬億MoE模型。據悉，盤古團隊提出Depth-Scaled Sandwich-Norm（DSSN）穩定架構和TinyInit小初始化的方法，在昇騰平臺上實現了超過18TB數據的長期穩定訓練。在訓練方法上，華爲團隊首次披露在昇騰CloudMatrix 384超節點上打通大稀疏比MoE強化學習（RL）後訓練框架的關鍵技術，使RL後訓練進入超節點集羣時代。

相關資訊

▣ AI早報 | 小米輔助駕駛再迎大將；華爲昇騰AI計算平臺訓練出準萬億MoE模型
▣ 昇騰原生，華爲發佈準萬億模型Pangu Ultra MoE模型架構和訓練細節
▣ 華爲發佈準萬億模型盤古Ultra MoE
《路透》：字節跳動計劃使用華爲升騰晶片訓練新AI模型
▣ 華爲的準萬億大模型，是如何訓練的？
▣ 百度百舸AI計算平臺4.0發佈：模型訓練有效時長達99.5%
▣ 騰訊公司申請模型訓練專利，提升模型訓練效果
▣ 華爲：昇騰AI芯片引領國內大模型訓練性能超越英偉達A100
▣ 稀宇科技推出萬億MoE模型abab 6.5
▣ 華爲發佈準萬億大模型
▣ 騰訊申請模型訓練相關專利，提高模型準確性
▣ MiniMax發佈萬億MoE模型abab 6.5
▣ 消息人士稱字節跳動計劃使用華爲芯片訓練新AI模型
▣ AI與機器人盤前速遞丨智元旗下機器人同時獲中美歐三方認證，華爲推出準萬億模型盤古Ultra MoE
▣ 騰訊公佈大語言模型訓練專利可提高模型準確性
▣ 《國際產業》字節跳動訓練新AI模型傳採華爲晶片
▣ 字節對MoE模型訓練成本再砍一刀成本可節省40%
▣ 全球首次！時序大模型突破十億參數，華人團隊發佈Time-MoE，預訓練數據達3000億個時間點
▣ 中國MoE一夜爆火！大模型新王暴打GPT-4o，訓練成本僅600萬美元
▣ Adobe購買視頻訓練AI模型，平均價格爲每分鐘3美元
六都首創！臺南打造AI文化生成平臺　萬張老照片訓練專屬模型
▣ 華爲模型訓練和車輛控制專利公佈可應用於AI領域
▣ 科大訊飛攜手華爲，實現基於國產算力的MoE模型推理方案
▣ 騰訊發佈最大開源MoE模型，3890億參數免費可商用
▣ 騰訊科技申請電池健康狀態估計模型訓練專利，提高用於電池健康狀態估計的模型的訓練效果
▣ 騰訊混元又來開源，一出手就是最大MoE大模型
▣ 騰訊開源：3D素材生成模型、最大MoE模型，兼容OpenAI SDK
▣ 字節開源MoE關鍵優化技術，模型訓練成本省40%、內部萬卡集羣已部署
▣ 獵戶星空發佈MoE大模型，推出AI數據寶AirDS

DMCA | PRIVACY | s@bg3.co