突破模擬計算世紀難題 新型晶片算力可超頂級GPU千倍

突破模擬計算世紀難題!陸研發新型晶片算力可超頂級GPU千倍。(示意圖:shutterstock/達志)

據觀察者網報導,微信公衆號「北京大學人工智慧研究院」13日消息,北京大學人工智慧研究院孫仲研究員團隊及合作者在國際學術期刊《Nature Electronics》雜誌發表論文,在新型計算架構上取得重大突破。

研究團隊成功研製出基於阻變存儲器的高精度、可擴展模擬矩陣計算晶片,首次實現了在精度上可與數位計算媲美的模擬計算系統,將傳統模擬計算的精度提升了驚人的五個數量級。相關性能評估表明,該晶片在求解大規模MIMO信號檢測等關鍵科學問題時,計算吞吐量與能效較當前頂級數字處理器(GPU)提升百倍至千倍。

據瞭解,我們熟悉的通信基地臺信號處理、AI大模型訓練參數優化等,本質都是在解複雜的矩陣方程。採用數位方法實現高精度矩陣求逆的計算開銷極大,耗時長、能耗高。於是,曾被視爲老舊技術的模擬計算重新進入研究視野,它直接利用物理定律實現並行運算,延時低、功耗低,在算力瓶頸背景下,具有先天優勢。

但如何讓模擬計算兼具高精度與可擴展性,從而在現代計算任務中發揮其先天優勢,一直是困擾全球科學界的世紀難題。

孫仲團隊選擇了一條融合創新的道路,通過新型信息器件、原創電路和經典算法的協同設計,構建了一個基於阻變存儲器陣列的高精度、可拓展的全模擬矩陣方程求解器,首次將模擬計算的精度提升至24位定點精度。

孫仲介紹,研究團隊基於迭代算法,結合了模擬低精度矩陣求逆和模擬高精度矩陣-向量乘法運算,開發了一種基於全模擬矩陣運算的高精度矩陣方程求解方案,先快速算出矩陣方程的「近似解」,再用「位切片」方法,實現迭代細化。

在計算精度方面,團隊在實驗上成功實現16×16矩陣的24比特定點數精度求逆,矩陣方程求解經過10次迭代後,相對誤差可低至10⁻⁷量級。在計算性能方面,在求解32×32矩陣求逆問題時,其算力已超越高端GPU的單核性能;當問題規模擴大至128×128時,計算吞吐量更達到頂級數字處理器的1000倍以上,傳統GPU幹一天的活,這款晶片一天就能搞定。同時,該方案在相同精度下能效比傳統數字處理器提升超100倍,爲高能效計算中心提供了關鍵技術支撐。

團隊將它應用到了「大規模MIMO(多輸入多輸出)信號檢測」中——僅用3次迭代,恢復的圖像就和原始圖像高度一致,誤碼率和32位數字計算效果相當,凸顯其在實時信號處理中的潛力。

「我們證明,模擬計算能以極高效率和精度解決現代科學和工程中的核心計算問題。」孫仲強調,這項突破的應用前景廣闊,可賦能多元計算場景,有望重塑算力格局。團隊的研究爲算力提升探索出一條極具潛力的路徑,有望打破數字計算的長期壟斷,開啓一個算力無處不在且綠色高效的新時代。