大陸國產AI新破口!華為、阿里押注「超節點」 不卷單卡性能

包括華爲、阿里正押注「超節點」,也就是不卷單卡性能追求「系統效率」,有機構指出,中美AI競爭從「單卡性能」走向「系統級效率」。圖爲華爲CloudMatrix 384超節點。華爲雲

儘管大陸AI落後美國,不過大陸國產AI已找到新破口,包括華爲、阿里正押注「超節點」,也就是不卷單卡性能追求「系統效率」,有機構指出,中美AI競爭從「單卡性能」走向「系統級效率」。

超節點,即Superpod,是一種用於構建大規模算力集羣的技術架構。此概念最早由輝達提出,指將數千張GPU集成在一個邏輯單元內,形成類似「超級計算節點」的系統。與傳統架構不同的是,超節點可以通過高速互聯技術,彌補原先伺服器間頻寬不足以及高時延等問題,以期實現算力效率的優化。

科創板日報報導,在不久前舉行的2025雲棲大會上,阿里雲發佈磐久128超節點AI伺服器。該伺服器集成阿里自研CIPU 2.0晶片和EIC/MOC高性能網卡,單櫃支持128個AI計算晶片。同等算力下,相較於傳統架構,該伺服器推理性能可提升50%。

除推理場景外,超節點也可用於AI訓練。今年4月,華爲推出CloudMatrix 384超節點,透過構建超過萬片的大集羣來提供算力。對於兆、十兆參數的大模型訓練任務,在雲資料中心,可將432個超節點級聯成最高16萬卡的超大集羣。

在9月召開的華爲全連接大會上,華爲表示CloudMatrix 384超節點已銷售300多套,共服務20多家客戶,主要需求來自政企。未來華爲還將推出Atlas 950 SuperPoD超節點,算力規模8192卡,預計於2026年第4季上市。新一代產品Atlas 960 SuperPoD算力規模將達到15488卡,預計2027年第4季上市。

華龍證券指出,中美AI競爭正從「單卡性能」走向「系統級效率」,大陸正在用集羣建設+開源生態+工程化交付的方式完成AI基建方面的彎道超車。實際上,當前還有更多大陸國產硬體廠商正在加速佈局超節點。

浪潮信息於8月7日發佈面向萬億(兆)參數大模型的超節點AI伺服器「元腦SD200」。沐曦股份已發佈多種超節點形態,包括光互連超節點、耀龍3D Mesh超節點、Shanghai Cube國產高密度液冷整機櫃以及高密度液冷算力POD。

百度智慧雲於8月28日發佈百舸AI計算平臺5.0版本。在算力方面,崑崙芯超節點正式啓用。

從技術方向看,超節點正在成爲AI基礎設施建設的新常態。民生證券認爲,先前市場更多關注晶片算力,但伴隨Scale up(縱向擴展)產業趨勢崛起,超節點已經重新定義AI基礎設施的範式。

該機構進一步指出,當超節點速率大幅提升,AI資料中心(AIDC)功率將迎來新挑戰。由於包括華爲CloudMatrix 384、輝達GB200NVL72在內的超節點單機櫃功耗普遍突破100KW,因此在算力密度指數級增加的情況下,超節點機櫃的溫控和電源系統將面臨挑戰。而當Atas950超節點採用全液冷模式時,互聯頻寬速率和算力速率均迎來大幅提升。