☰

日本理化學研究所攜手NVIDIA打造下一代超級電腦「富嶽Next」，性能將比當前提升100倍

日本理化學研究所 (理研,RIKEN)日前宣佈啓動「富嶽Next」超級電腦開發計劃，除了再度與富士通攜手合作，同時也宣佈將NVIDIA作爲重要夥伴，新系統預計於2030年在神戶中央區啓用，目標打造一款兼顧傳統高效能運算 (HPC)與人工智慧 (AI)的新世代超級電腦，整體應用效能預期將比現行富嶽 (Fugaku)提升100倍，約可實現50EFLOPS、Zetta級別運算效能。

從Arm架構HPC邁向AI HPC

富嶽於2020年啓用時，憑藉富士通A64FX Arm架構處理器成爲全球最快超級電腦之一，同時也讓Arm架構CPU在HPC領域站穩腳步。不過，隨着近年AI大型語言模型與生成式AI應用興起，HPC的角色也正在轉變。

日本理化學研究所表示，富嶽Next不僅將延續傳統的模擬與科學運算能力，更要與AI運算緊密結合，包含用於車輛空氣力學模擬設計、藥物研發、量子模擬等多樣化應用場景。目標是在傳統HPC上達到5至10倍性能提升，同時在AI運算上挑戰Zetta級別運算效能，並且透過雙軌並進方式，讓應用程式整體效能躍升100倍。

富士通MONAKA-X搭配NVIDIA GPU

富嶽Next將採用富士通新一代Arm指令集CPU「FUJITSU-MONAKA-X」，並且透過NVLink連接技術與NVIDIA GPU高速互連。而這也是日本頂尖HPC首度導入GPU加速架構，象徵日本超級電腦正式邁向AI HPC時代。

更關鍵的是，理研與富士通並非單純引入硬體，而是希望藉由NVIDIA CUDA-X軟體堆疊，讓富嶽Next可直接運用多款針對科學與AI的開發工具，其中包括NVIDIA cuQuantum (量子模擬)、RAPIDS (數據科學)TensorRT (AI推論)、NeMo (大型語言模型訓練與應用)，意味富嶽Next不僅是傳統超級電腦的升級，更是可支撐AI模型訓練與產業應用的全新國家級平臺。

依照先前日本理化學研究所規劃性能，富嶽Next在理論FP64向量運算效能目標爲CPU部分可達48 PFLOPS以上，加速部則瞄準3.0 EFLOPS以上。

另外，在理論FP16/BF16矩陣運算效能方面，CPU部分將達到1.5 EFLOPS以上，加速部則爲150 EFLOPS以上。至於理論FP8矩陣運算效能，CPU部分可達3.0 EFLOPS以上，而加速部更是以300 EFLOPS以上爲目標。

此外，主記憶體容量方面，CPU與加速部各自規劃爲10 PiB以上，主記憶體頻寬則預期CPU部分可達7 PB/s以上，而加速部則高達800 PB/s以上。

而在儲存系統的效能與容量配置方面，第一層級將作爲在地儲存的檔案系統，目前考慮採用CHFS等檔案系統方案，其設計目標爲資料總記憶體傾印時間需在1分鐘以內完成、IOPS需在1秒以內完成，容量則需達到總記憶體大小的兩倍以上。

在第二層級則定位爲共享儲存，檔案系統考慮Lustre或DAOS，設計目標是記憶體傾印時間需在5分鐘以內，IOPS爲第一層級的10分之一，容量則需達到總記憶體大小的30倍以上。

研究團隊表示將確保富嶽到富嶽NEXT之間的資料平順移轉，同時解決因儲存節點記憶體不足而導致的I/O存取效能不穩定問題，推進能實現穩定效能的硬體與軟體設計。此外，也將推動可持續發展的檔案系統軟體研發。

在系統網路方面，富嶽Next將由兩種互連方式組，其中包含用於加速運算的規模提升 (Scale-up)網路，另一是用於節點互連的規模擴散 (Scale-out)網路。其中，規模提升網路除了能互連同一節點內的多個GPU，也能透過交換器互連多節點GPU，並且組成Pod運算叢集。而規模擴散網路則考慮採用支援IP或RDMA的開放式規格，並且可能採用多層交換器構成的間接網路架構。

至於富嶽NEXT的總耗電量 (包含運算節點與儲存系統)將控制在40MW以下。相比現有的富嶽耗電量約爲30MW，富嶽NEXT雖然大幅提升運算性能，但控制耗電增加的幅度也明顯提升。

富嶽Next具體設計將從2026年開始動工，預計在2028年完成，並且於2029年投入製造、設置及調整，並且目標在2030年開始投入運用。

標準化與全球供應策略

與現行富嶽爲日本量身打造不同，理研強調富嶽Next將採取「與日本共同製造」的模式，透過標準化設計，讓相同架構能延伸應用至其他國際HPC系統，進一步提升日本在全球影響力。

富士通也透露，MONAKA-X不會僅限於提供富嶽Next使用，未來也將提供給Supermicro等企業使用，展現此架構CPU的商業化潛力。

製程與GPU規格仍待確認

目前富士通尚未公開MONAKA-X的代工廠，只透露將採用1.4nm製程。而現行A64FX是由臺積電代工生產，因此外界推測臺積電依然是可能的候選合作對象，但富士通同時也參與日本本土晶片計劃Rapidus，因此也有可能出現其他後選可能。

至於NVIDIA提供的GPU規格目前也未確定，NVIDIA HPC副總裁Ian Buck透露富嶽Next不見得會採用現行的Blackwell，或是即將問世的Rubin顯示架構GPU，而是會隨着技術演進，持續導入最合適的方案，因此從距離2030年正式上線運作仍有五年時間來看，或許有可能會採用先前預告將於2028年推出的Feynman(費曼)，或是更後推出的顯示架構GPU。

《原文刊登於合作媒體mashdigi，聯合新聞網獲授權轉載。》

日本理化學研究所攜手NVIDIA打造下一代超級電腦「富嶽Next」，性能將比當前提升100倍

相關資訊