陸螞蟻集團以本土晶片訓練AI媲美輝達H800 成本大降2成

大陸螞蟻集團以本土晶片訓練AI大模型,效果媲美輝達H800,成本還大降2成。(圖/中新社)

近期有知情人士對外媒透露,大陸螞蟻集團正使用中國本土製造的半導體來開發AI模型訓練技術,這將使成本降低20%。而且令人意外的是,這種來自阿里巴巴與華方的晶片採用專家混合(Mixture of Experts,MoE)機器學習方法來訓練模型,測試結果與採用輝達H800等晶片測試的結果極爲相似。

據《網易新聞》報導,《彭博》引述知情人士提供訊息稱,螞蟻目前仍在使用輝達的晶片進行 AI 開發,但在最新的模型中,主要依賴的是來自AMD和中國廠商的替代晶片。

報導說,螞蟻集團 CTO、平臺技術事業羣總裁何徵宇帶領 Ling Team 團隊,打造了兩款開源MoE模型:Ling-Lite 和 Ling-Plus。前者參數規模爲168億,後者參數規模高達2900億。

據螞蟻集團本月發佈的研究論文顯示,該技術團隊在模型預訓練階段使用較低規格的硬體系統,將計算成本( 635 萬元人民幣/兆Token)降低約 20%,達508萬元人民幣,但模型效能卻能與Qwen2.5-72B-Instruct和DeepSeek-V2.5-1210-Chat相媲美。

論文中也指出,即使是硬體或模型結構的微小改動,也可能引發問題,比如導致模型的錯誤率突然上升。其部分模型在某些基準測試中超越了Meta,但該數據尚未經過獨立驗證。知情人士稱,螞蟻計劃使用這兩個新模型在醫療和金融領域提供AI 服務。

陸媒指出,螞蟻集團的研究正加速AI技術本土化,以降低成本並減少對美國高端晶片的依賴。

據公開資料顯示,輝達H800是英偉達研發的晶片,專爲高性能計算和人工智慧訓練設計的高端GPU晶片,廣泛應用於資料中心和AI模型訓練場景。從2023年起,輝達特供給中國的A800與H800晶片從12萬(人民幣,下同)左右,漲到近30萬,甚至還出現高達50萬一片。2023年9月,H800伺服器價格約210萬元/臺,後在同年10月,因限售政策漲至350萬元/臺。2025年市場資料顯示,H800整機價格穩定在230萬元左右。