從芯片到超節點 國產算力合縱連橫大時代開啓

21世紀經濟報道記者駱軼琪 大同報道

從DeepSeek主動擁抱國產芯片生態,到一批國產超節點服務器陸續登場,國產算力產業鏈的合縱連橫大時代正在開啓。

2025中國算力大會期間,21世紀經濟報道記者多方走訪發現,國產算力生態鏈,一方面在從芯片到服務器再到智算集羣的一整條路徑上,通過產業聚合方式尋求更高效的解法;另一方面,大模型廠商和平臺型廠商也在加速推動應用更快、更好落地。

一名芯片公司高管對21世紀經濟報道記者指出,“我們很高興看到,UE8M0 FP8這樣的路線會被DeepSeek投入到具體應用中,同時也很樂於見到,有DeepSeek這類企業告訴大家哪些是趨勢。這可以讓我們國產芯片廠商,未來有更多機會與模型廠商發揮協同作用,共同讓計算效率提升到新的水平。”

聯想集團副總裁、中國基礎設施業務羣總經理陳振寬接受21世紀經濟報道記者採訪時則指出,“最近超節點非常熱,這個屬於Scale up的範疇,我們已開始投入資源來開發超節點技術和產品,重點就是對互聯網絡技術的研發;在Scale out的集羣上,我們重點投入推理場景下的PD分離技術,助力算力集羣的Token生產效率。”

大會期間發佈的“年度重大突破成果”,更是凸顯出國內計算、通信、電力行業龍頭,在大模型時代聯手解決大模型跨域訓練、落地難、耗電量高等命題。

這早已不是單點突破的孤軍深入,而是多路徑並進的協同作戰。從芯片架構的原始創新,到超節點間的高速互聯,再到系統級的能效重構,整條產業鏈正形成一種高度耦合、共振前行的生態格局。這不僅是一場場技術攻關,更是一次圍繞算力自主的體系性躍遷。

國產算力抱團

一條算力產業鏈的拉通,涉及從底層芯片,到軟件生態、服務器整機、智算集羣等多個產業環節牽引,彼此開源/開放是破局關鍵路徑之一。

近期DeepSeek在官方平臺發出的簡單一句話,就引發了市場熱烈關注。

“DeepSeek雖然只是用了一句話點明UE8MO,但其實已經說得挺明白。這不是一個全新的東西,實際上可以讓我們在做一些相對低精度的計算時,幫助恢復一定精度。”前述芯片公司高管對21世紀經濟報道記者分析,簡單來說,它能夠提高計算效率,同時減少存儲和數據傳輸的開銷。

當然,該名高管也對記者指出,對於其所在芯片公司來說,一方面會沿着DeepSeek爲代表的精益求精路線,在有限資源範圍內,儘可能多推進計算實現;另一方面仍然不可忽視OpenAI“大力出奇跡”的路線。“我們認爲兩條路線都應重視,只有本身基礎設施能力到一定高度後,才能吸引終端應用和生態願意在你的芯片平臺上開發並促成具體實現。”

這是國產算力生態並肩探索的冰山一角。

在算力大會期間,中國移動、之江實驗室、百度等國內數十家運營商、互聯網企業、芯片廠商、服務器製造商及科研院所,共同啓動智算開放互聯OISA生態共建戰略合作,併發布OISA 2.0(Omni-directional Intelligent Sensing Express Architecture,智感互聯架構)協議,則是從平臺型生態方面邁出的更進一步。

據21世紀經濟報道記者瞭解,OISA技術體系主要是爲GPU卡間互聯提供高性能方案,也就是可以支撐超節點智算集羣的scale up路線。該體系目前正在聯合GPU、Switch(交換機)、整機等夥伴推動OISA IP、芯片和超節點研發,進而推動OISA規模落地。

資料顯示,相較於OISA 1.1版本,OISA 2.0將支持的AI芯片數量提升至1024張,帶寬突破TB/s級別,AI芯片互聯時延縮短至數百納秒。

此外,記者在中國移動現場展臺看到,面向智算中心scale out路線,公司還原創了全調度以太網(GSE)技術體系,目前已經發布全套技術標準,完成中試驗證,發佈首套支持千卡級組網能力的商用產品;接下來還將推進技術規範和大容量交換芯片發佈等工作。

一名行業從業者如此對記者分析,在國產芯片亟需補全軟件生態能力過程中,從兩種集羣路線上都搭建統一平臺,也是希望強化生態聚合效應。

同泰怡產品中心總經理馬澤則對21世紀經濟報道記者表示,公司作爲服務器廠商,針對目前市場上多元化的算力需求,做了諸多針對性佈局。

“服務器只是一個底座,其中最重要的就是GPU卡,這主要分爲國際和國內兩部分。”他進一步指出,國際GPU芯片主要是指英偉達,同泰怡自2022年開始就是英偉達的OEM合作伙伴。對於國產GPU企業而言,更大挑戰還是來自生態構建,國產GPU在生態建設上還處於起步階段,缺乏成熟的軟件工具和開發者支持,限制了其市場拓展能力。國產GPU企業需要積極與產業鏈上下游企業合作,同時通過開放平臺等方式吸引開發者加入,形成良性循環。這是一個長期且複雜的過程,需要硬件、軟件、應用等多方面的協同努力。

“我們會積極與這些國產GPU卡進行軟硬件適配等工作,給客戶提供一個穩定、好用的硬件底座,目前我們與頭部國產GPU芯片廠商都有深度合作,希望共同完善國產算力生態。”他進一步指出。

異構計算優化落地

當前市場正面臨多類型、多廠商AI芯片並存的局面,從智算集羣搭建到集成方案落地過程中,如何針對異構計算能力進行兼容優化並真正落地行業應用也是重要命題。

“算力調度機制不同,融合調度機制將成爲實現超智融合過程中,最需要首先解決的問題。”陳振寬對21世紀經濟報道記者分析,高性能計算與智算的融合首先體現在硬件架構的深度重構。傳統高性能計算以CPU爲核心,側重雙精度浮點運算(FP64),而智算依賴GPU/TPU等加速芯片,聚焦半精度(FP16)和整數運算(INT8)。兩者的硬件架構和計算範式存在本質差異,這種架構差異在AI for Science場景中形成瓶頸。而高性能計算的“時間複雜度”與智算的“空間複雜度”難以兼容,融合需從芯片設計、存儲網絡到算法層面實現軟硬協同創新。

“面對高性能計算、智算、通算融合難題,平臺化的解決方案似乎成爲了當前狀態下的最優解。聯想通過‘一橫五縱’戰略框架構建了覆蓋通用、科學、AI算力的異構智算平臺——聯想萬全異構智算平臺。”他續稱。

算力大會期間發佈的《2025智算服務發展報告》也進行了分析,其中提到,當前,我國智算中心建設熱度持續高漲,但在推進過程中面臨多重挑戰,主要集中在基礎設施規劃建設、大模型開發效能優化以及產業應用深度貫通等方面。

該報告指出,智算中心服務需重點推進四大舉措:推進覆蓋建設、開發、應用的全流程標準體系建設;強化基礎設施層智能調度、模型層自動化調優、應用層AI智能體等核心技術自主創新;建立“政產學研用”協同生態,打通“硬件研發—算力供給—場景應用”全鏈條;面向醫療、教育、能源等重點領域開展專項行動,培育算力服務商突破“最後一公里”落地瓶頸。

除了雲端的大規模集羣訓練推理之外,今年以來再度火熱的一體機品類,則更適合端側推理需求強的行業或場景。

馬澤對21世紀經濟報道記者表示,DeepSeek是基礎大模型,具體的應用行業有垂域模型,DeepSeek與行業大模型的結合,本質是通過“通用基座+垂直增強”的模式,實現技術能力與行業需求的精準匹配

“這中間需要花費比較大的精力。”他坦言,在落地應用過程中,需要一體機提供商結合行業用戶的具體業務場景,針對性去做模型適配、參數調優、性能測試等工作,由此才能將一體機的能力更好發揮,並真正賦能場景落地。

據悉,針對國產化場景需求,同泰怡構建了覆蓋“輕量化”至“滿血版”大模型的全棧解決方案矩陣,並與行業客戶開展POC測試,在教育、能源、電網、政務、醫療等行業實現了方案落地,助力客戶應用升級優化。

攻克液冷難題

對於智算中心建設本身來說,也面臨如何更好推進能效優化的命題。在政策指引和市場需求驅動下,冷板式液冷方案正受到廣泛關注,當然其還有持續優化空間。

“目前主流的液冷技術包括冷板式液冷和浸沒式液冷,其中冷板式液冷相對來說改造起來更快,浸沒式液冷部署時的技術複雜度更高。”馬澤對記者表示,目前來看,客戶對風冷散熱技術的關注度依然較高,其原因在於,液冷技術相對風冷,前期會有較大投入,此外涉及對老舊機房的改造,會讓液冷部署受到供電、散熱、承重、運維等方面的條件限制。

“當然目前國家對新建數據中心有明確的PUE(電源使用效率)要求,因此對於這類數據中心建設來說,液冷成爲必須攻克的命題。”他進一步分析,液冷技術不僅能大幅降低能耗,還能提升算力密度,讓GPU或CPU的性能發揮得更好。實際上從長週期看,部署液冷散熱後,可以降低PUE、提高能效比、大幅節電,因此從長週期來說,配備液冷散熱技術的數據中心,其長期TCO(總擁有成本)優勢更顯著。

中國信通院發佈的《智算中心液冷產業全景研究報告(2025年)》提到,根據實驗數據,當芯片功率超過300W時,傳統風冷系統散熱能力便已失效,芯片熱失控風險急劇升高。液冷技術利用液體比熱容高於空氣的優勢,通過與發熱元器件緊密結合,實現對芯片精準散熱,芯片結溫可降低約15°C至25°C,充分滿足了高密部署場景下的芯片散熱需求。

對於在智算中心的方案落地,該報告中指出,冷板式液冷系統在基礎設施架構與運維模式上與風冷系統高度兼容,可充分借鑑成熟的風冷設計與運維經驗,具備良好的工程落地基礎。此外,對於風冷智算中心改造項目,採用冷板式液冷改造方式,可最大限度保留服務器主板原有形態,方案實施難度低、改造週期短、綜合成本可控,具備較強的可操作性與推廣價值。

陳振寬對記者透露,聯想在和清華大學合作,開發雙循環的浸沒式液冷技術,對產品會有很高適應性,非常匹配目前靈活變化的AI算力需求。接下來,聯想正推動低成本冷板方案的應用,實現風液同價目標;此外聯想也已着手研發相變冷板,以應對未來更高功耗芯片的散熱需求。

此次算力大會期間,聯想就展示了今年推出的“雙循環”相變浸沒製冷系統,實際落地PUE值達1.035。“這意味着,你可以將96.6%的電費,都用在AI訓練、推理上。”他續稱。

當前,國產算力產業鏈正以高度協同的態勢,形成跨領域、多層次的產業協作,開放協議、聚合生態是重要方向。這不僅會推動國內算力產業角色的技術螺旋上升,更是一場面向未來的系統進化。