華爲將發佈AI推理突破性成果,國產算力生態關鍵環節再獲升級

華爲將於8月12日在2025金融AI推理應用落地與發展論壇上,發佈AI推理領域的突破性技術成果。這項成果或能降低中國AI推理對HBM(高帶寬內存)技術的依賴,提升國內AI大模型推理性能,完善中國AI推理生態的關鍵部分。

消息面上,華爲在AI推理技術上的探索早已有之。今年3月,北京大學攜手華爲推出了DeepSeek全棧開源推理方案。該方案融合了北京大學自研的SCoW算力平臺系統與鶴思調度系統,並整合了DeepSeek、 openEuler、MindSpore及vLLM/RAY等開源組件,實現了在華爲昇騰平臺上的高效推理。這一合作成果不僅展示了華爲在AI推理領域的深厚積累,也標誌着國產算力在AI應用上的重要突破。

長城證券表示,從國內大模型的進展來看,一方面,伴隨國內外大模型的持續升級,AI推理能力要求更高,對算力的需求也在持續增加;另一方面,芯片的性能不斷提升也同時促進大模型等在AI產業持續取得突破。同時,隨着AI模型仿真活人的能力持續提升,助力更多 Al+應用商業場景落地,基於AI的數字互動有望成爲下一個互聯網和遊戲產業的熱門賽道,算力各環節有望進一步發展。

相關研究機構表示,AI大模型訓練對內存帶寬需求呈指數級增長,傳統DDR內存已無法滿足需求。 HBM(高帶寬內存)通過3D堆疊技術將DRAM芯片垂直堆疊,最新的HBM3E可實現高達819GB/s的帶寬,較DDR5提升5倍以上。在AI服務器中,HBM的成本佔比約爲20%至30%,僅次於用於計算的AI芯片。

本文源自:金融界