解析清微智能“創新路徑” 透視AI芯片競合格局

(原標題:解析清微智能“創新路徑” 透視AI芯片競合格局)

這是AI大模型算力需求爆炸式增長的時代。提供算力的AI芯片正面臨“效率牆”“互聯牆”“存儲牆”的三重挑戰。

中國在芯片賽道上如何贏得優勢?國產替代的關鍵在哪?近日,清微智能創始人王博在接受《中國經濟週刊》記者採訪時,對這些問題一一解答。

這家被譽爲“清華AI雙子星”的企業,正以原創的可重構AI芯片(RPU)爲突破口,在國產芯片賽道探索出一條差異化新路線。

清微智能TX81芯片

AI芯片兩大門派:GPU和數據流

“可重構AI芯片RPU是區別於GPU的另一大AI芯片技術流派——‘數據流派’的典型代表。它的原理就像鐵路‘扳道岔’,鐵軌換成了芯片裡的計算單元。”王博拋出一個形象比喻,“傳統芯片是固定軌道,只能跑一種‘火車’;可重構芯片有無數電子‘道岔’,能隨時切換計算單元連接方式,讓同一顆芯片適應語音識別、圖像分析、訓練推理等不同任務。”

這種動態重構能力,讓可重構芯片與GPU相比,可以實現更高的算力效率、可擴展性、併發能力和性價比。

華泰證券海外科技首席、執行董事何翩翩認爲,可重構芯片的長期價值和增長潛力來自其爲特定AI工作負載提供卓越性能和效率的能力。“後續能否建立起強大的軟件生態系統決定其能否吸引開發者從現有GPU生態轉向。”何翩翩表示,儘管英偉達爲代表的“GPU派”主導地位不易被撼動,但新興的可重構數據流架構正在AI芯片領域開闢重要的市場,並推動着創新向前發展。

國際半導體技術路線圖(ITRS)將可重構芯片列爲“未來最具前景芯片架構技術”,可重構芯片已被學術界和產業界視爲CPU、FPGA和GPU之外的第四類通用計算芯片。

王博透露,清微去年量產的雲端算力芯片TX81,在同等1000P算力規模下相比GPU集羣具備更強的互聯和效率優勢,一經推出市場反響強烈,半年多時間已在國內落地多個百卡、千卡智算中心。截至目前,算力卡訂單累計近20000張。

放眼全球,以可重構數據流爲代表的“數據流派”呈現蓬勃發展態勢。美國斯坦福大學孵化的公司SambaNova,通過自研的可重構芯片產品成爲AI芯片獨角獸企業,其產品能夠支持5萬億參數模型訓練,推理性能上,其8芯配置性能爲英偉達H100的3.1倍;美國芯片初創公司Groq開發的張量流式處理器架構LPU(Language Processing Unit),推理速度相較於英偉達GPU提高10倍,成本僅爲十分之一;特斯拉在專爲AI訓練自研的Dojo超算系統中也採用了該類型芯片架構,成爲特斯拉實現FSD智能輔助駕駛系統的核心基礎設施。

近期,全球最大的人工智能芯片客戶之一OpenAI開始租用谷歌TPU芯片,TPU也是數據流芯片的典型代表。對此,王博認爲這個信號對於AI的長期發展是有利的。全球AI算力需求增長迅猛,高度依賴單一廠商或單一技術路徑的局面,會限制技術的競爭演進。

王博表示,好的技術生態就像江湖中的武林門派,既有合縱連橫,也能各顯神通。“GPU”和“數據流”就像是AI芯片界的少林武當,以谷歌TPU、清微RPU爲代表的新技術流派近年來逐漸站上“華山之巔”,有利於推動全球AI產業健康可持續發展,就像汽車產業發展也曾經歷燃油車、電動車、混動車等多個技術路徑並行發展的階段。

“後面的故事大家都看到了,電動車通過智能化、網聯化和製造工藝的變革實現追趕,與燃油車路線並駕齊驅,中國汽車產業更是藉此在全球汽車產業實現‘換道超車’。”王博表示,人工智能時代,中國要實現算力產業真正的自主可控,在國際主流的兩大技術流派上都應該有佈局和發力。

清微REX1032訓推一體服務器

持續創新 中國 AI 和全球同頻演進

“目前我們正在開展C輪融資。”王博透露,清微是國家集成電路產業投資基金投資的唯一新型架構算力芯片企業。公司此前也獲得北京信息產業發展投資基金、國開裝備基金等國資支持,商湯、螞蟻等頭部企業也對清微進行了資本與產業賦能。

在除GPU以外,另一大AI芯片發展路徑上實現國際領跑,這是清微智能在中國算力產業版圖中具有舉足輕重地位的重要原因。截至目前,清微可重構芯片全球累計出貨量超2000萬顆。“國家隊+產業鏈”的投資結構,也彰顯了市場對可重構技術和清微智能的認可。2024年,清微智能入選首批國家級專精特新重點“小巨人”。

談及企業成功的關鍵因素,王博語氣中滿是感慨:“清微智能的技術底座是依託清華大學可重構實驗室近20年積澱。技術爲本是刻在清微基因裡的。我們500多人的團隊用6年時間、數十億元的研發費用,把可重構架構的芯片從0到1做出來,這是一個難以想象的浩瀚工程。”

刻在基因裡的技術驅動力也讓清微始終保持對新技術的敏銳洞察和堅定投入。近期,清華大學研究團隊在2025國際計算機體系結構研討大會(ISCA)上發表了國際上首個晶圓級芯片計算架構與集成架構協同設計體系,取得了國內外學術界與工業界的廣泛認可。

“國際上已基本共識,晶圓級芯片是AI芯片的下一個主要迭代方向。”清華大學集成電路學院副教授胡楊介紹,晶圓級芯片能夠在單位空間內集成更多單元電路,具有更高的晶體管密度與算力。同時,未經切割的晶圓上的電路單元與金屬互連排列更緊密,從而形成帶寬更高、延時更短的互連結構。“在相同算力下,由晶圓級芯片構建的算力集羣佔地面積對比GPU集羣能夠縮小10~20倍以上,功耗可降低30%以上。”胡楊表示。

華泰證券海外科技首席、執行董事何翩翩認爲,隨着AI芯片數量的增加,芯片間的互聯速率成爲主要瓶頸,嚴重限制了AI訓練和推理的有效擴展。晶圓級芯片直接且根本性地解決了這一問題。這種設計實現了巨大的內部帶寬和低延遲,特別是對於需要頻繁數據交換的大模型的未來發展至關重要。

目前,全球僅有特斯拉、Cerebras兩家公司推出了晶圓級芯片產品。王博透露,清微智能正在與清華大學聯合推進國內晶圓級芯片的工程化設計和產品化落地。

“相比短平快的仿製路線,選擇新架構實現‘換道超車’纔是真正的高階國產替代。”王博表示,清微智能押注未來3到5年的算力革命,實施“研發一代、儲備一代、釋放一代”的技術戰略。其中,已釋放的技術成果正在積極推進商業化落地;處於儲備階段的技術,聚焦未來幾年可重構計算的技術升級需求;前瞻性研發則依據技術發展趨勢,佈局算力領域關鍵技術賽道。

“我們手中還有很多技術牌可以打。清微智能在可重構這個技術路徑上的能力儲備,在國內還沒有同量級的選手,我們希望在第四次工業革命這一大變革時代,走出一條中國新路線,提供一種中國新方案。”王博對未來信心滿滿。

記者手記

走進清微智能的大門,我見到了王博。這位70後創業者散發着濃厚的工程師氣息。簡約的藍襯衫,辦公室佈置得十分簡潔。

採訪一開始,王博便展現出言簡意賅的風格。當被問及爲何選擇國產高階替代這條佈滿荊棘的道路時,他沉默片刻,緩緩說道:“總要有人去走最難的路。”

清微智能創始人兼CEO王博

這句樸實的話語背後,是他特有的使命感——明知從0到1的突破意味着資金壓力、技術瓶頸和漫長週期,卻依然選擇迎難而上。

回溯過往,王博這批70後創業者成長於中國信息技術從萌芽到蓬勃發展的關鍵時期,他們親歷了全球技術浪潮的劇烈更迭,目睹了無數企業因技術滯後被時代淘汰,也見證了抓住技術變革機遇實現跨越式發展的傳奇。

芯片的競爭是一場馬拉松,每一家參與其中的企業都需具備長跑的心態和體質。縱觀全球,英偉達成立32年,AMD走過56年曆程,英特爾更是歷經57年風雨,這些行業巨頭的發展史無不印證,硬核科技領域的競爭,絕非一朝一夕的爆發力能制勝。創業者不僅要在技術浪潮奔涌時躬身入局,更需要在漫長的發展週期中,始終保持追趕的耐力及眼力,這或許正是閱盡千帆的70後創業者的優勢所在。唯有堅持長期主義,才能在芯片產業的賽道上行穩致遠。