華爲發佈準萬億模型盤古Ultra MoE

【華爲發佈準萬億模型盤古Ultra MoE】《科創板日報》30日訊,《科創板日報》記者獲悉,華爲推出參數規模7180億的新模型——盤古Ultra MoE,這是一個全流程在昇騰AI計算平臺上訓練的準萬億MoE模型。華爲同時發佈盤古Ultra MoE模型架構和訓練方法的技術報告。在訓練方法上,華爲首次披露在昇騰CloudMatrix 384超節點上,打通大稀疏比MoE強化學習(RL)後訓練框架的關鍵技術,使RL後訓練進入超節點集羣時代。 此外,近期發佈的盤古Pro MoE大模型,在參數量爲720億,激活160億參數量的情況下,大模型榜單SuperCLUE的2025年5月排行榜上,位居千億參數量以內大模型排行並列國內第一。(記者 黃心怡)