日本理化學研究所攜手NVIDIA打造下一代超級電腦「富嶽Next」,性能將比當前提升100倍
日本理化學研究所 (理研,RIKEN)日前宣佈啓動「富嶽Next」超級電腦開發計劃,除了再度與富士通攜手合作,同時也宣佈將NVIDIA作爲重要夥伴,新系統預計於2030年在神戶中央區啓用,目標打造一款兼顧傳統高效能運算 (HPC)與人工智慧 (AI)的新世代超級電腦,整體應用效能預期將比現行富嶽 (Fugaku)提升100倍,約可實現50EFLOPS、Zetta級別運算效能。
從Arm架構HPC邁向AI HPC
富嶽於2020年啓用時,憑藉富士通A64FX Arm架構處理器成爲全球最快超級電腦之一,同時也讓Arm架構CPU在HPC領域站穩腳步。不過,隨着近年AI大型語言模型與生成式AI應用興起,HPC的角色也正在轉變。
日本理化學研究所表示,富嶽Next不僅將延續傳統的模擬與科學運算能力,更要與AI運算緊密結合,包含用於車輛空氣力學模擬設計、藥物研發、量子模擬等多樣化應用場景。目標是在傳統HPC上達到5至10倍性能提升,同時在AI運算上挑戰Zetta級別運算效能,並且透過雙軌並進方式,讓應用程式整體效能躍升100倍。
富士通MONAKA-X搭配NVIDIA GPU
富嶽Next將採用富士通新一代Arm指令集CPU「FUJITSU-MONAKA-X」,並且透過NVLink連接技術與NVIDIA GPU高速互連。而這也是日本頂尖HPC首度導入GPU加速架構,象徵日本超級電腦正式邁向AI HPC時代。
更關鍵的是,理研與富士通並非單純引入硬體,而是希望藉由NVIDIA CUDA-X軟體堆疊,讓富嶽Next可直接運用多款針對科學與AI的開發工具,其中包括NVIDIA cuQuantum (量子模擬)、RAPIDS (數據科學)TensorRT (AI推論)、NeMo (大型語言模型訓練與應用),意味富嶽Next不僅是傳統超級電腦的升級,更是可支撐AI模型訓練與產業應用的全新國家級平臺。
依照先前日本理化學研究所規劃性能,富嶽Next在理論FP64向量運算效能目標爲CPU部分可達48 PFLOPS以上,加速部則瞄準3.0 EFLOPS以上。
另外,在理論FP16/BF16矩陣運算效能方面,CPU部分將達到1.5 EFLOPS以上,加速部則爲150 EFLOPS以上。至於理論FP8矩陣運算效能,CPU部分可達3.0 EFLOPS以上,而加速部更是以300 EFLOPS以上爲目標。
此外,主記憶體容量方面,CPU與加速部各自規劃爲10 PiB以上,主記憶體頻寬則預期CPU部分可達7 PB/s以上,而加速部則高達800 PB/s以上。
而在儲存系統的效能與容量配置方面,第一層級將作爲在地儲存的檔案系統,目前考慮採用CHFS等檔案系統方案,其設計目標爲資料總記憶體傾印時間需在1分鐘以內完成、IOPS需在1秒以內完成,容量則需達到總記憶體大小的兩倍以上。
在第二層級則定位爲共享儲存,檔案系統考慮Lustre或DAOS,設計目標是記憶體傾印時間需在5分鐘以內,IOPS爲第一層級的10分之一,容量則需達到總記憶體大小的30倍以上。
研究團隊表示將確保富嶽到富嶽NEXT之間的資料平順移轉,同時解決因儲存節點記憶體不足而導致的I/O存取效能不穩定問題,推進能實現穩定效能的硬體與軟體設計。此外,也將推動可持續發展的檔案系統軟體研發。
在系統網路方面,富嶽Next將由兩種互連方式組,其中包含用於加速運算的規模提升 (Scale-up)網路,另一是用於節點互連的規模擴散 (Scale-out)網路。其中,規模提升網路除了能互連同一節點內的多個GPU,也能透過交換器互連多節點GPU,並且組成Pod運算叢集。而規模擴散網路則考慮採用支援IP或RDMA的開放式規格,並且可能採用多層交換器構成的間接網路架構。
至於富嶽NEXT的總耗電量 (包含運算節點與儲存系統)將控制在40MW以下。相比現有的富嶽耗電量約爲30MW,富嶽NEXT雖然大幅提升運算性能,但控制耗電增加的幅度也明顯提升。
富嶽Next具體設計將從2026年開始動工,預計在2028年完成,並且於2029年投入製造、設置及調整,並且目標在2030年開始投入運用。
標準化與全球供應策略
與現行富嶽爲日本量身打造不同,理研強調富嶽Next將採取「與日本共同製造」的模式,透過標準化設計,讓相同架構能延伸應用至其他國際HPC系統,進一步提升日本在全球影響力。
富士通也透露,MONAKA-X不會僅限於提供富嶽Next使用,未來也將提供給Supermicro等企業使用,展現此架構CPU的商業化潛力。
製程與GPU規格仍待確認
目前富士通尚未公開MONAKA-X的代工廠,只透露將採用1.4nm製程。而現行A64FX是由臺積電代工生產,因此外界推測臺積電依然是可能的候選合作對象,但富士通同時也參與日本本土晶片計劃Rapidus,因此也有可能出現其他後選可能。
至於NVIDIA提供的GPU規格目前也未確定,NVIDIA HPC副總裁Ian Buck透露富嶽Next不見得會採用現行的Blackwell,或是即將問世的Rubin顯示架構GPU,而是會隨着技術演進,持續導入最合適的方案,因此從距離2030年正式上線運作仍有五年時間來看,或許有可能會採用先前預告將於2028年推出的Feynman(費曼),或是更後推出的顯示架構GPU。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》