Arm GPU大變,集成神經加速器

來源:半導體行業觀察

編譯自theregister。

芯片設計公司 Arm 正在爲其手機 GPU 藍圖引入專用神經加速器硬件。該公司希望此舉能夠提供更高質量的視覺效果,同時提升 AI 性能。

這家總部位於英國的科技公司表示,其計劃於 2026 年推出的移動圖形處理器設計將採用神經技術,可將 GPU 工作負載減少一半,並在未來支持其他 AI 功能。Arm 還發布了一款開發工具包,方便程序員立即上手,此外還推出了 Vulkan Graphics API 的機器學習擴展 (ML Extensions)。

Arm 最初設想將神經加速用於在不影響性能的情況下將圖形分辨率提升到更高。其他設想的用途包括使用插值技術將幀速率提高一倍,以及通過在移動設備上以更少的每像素射線實現實時路徑追蹤來提升圖像質量。

“隨着人工智能與實時圖形的日益融合,我們需要基於 GPU 的人工智能,它必須緊密集成、性能卓越,最重要的是,還要節能。而讓開發者能夠輕鬆地在 GPU 上開發人工智能,正是我們這裡討論的技術創新的驅動力。”Arm 人工智能與開發者平臺研究員 Geraint North 表示。

在包含神經加速器的 Mali GPU 發佈之前,Arm 拒絕分享有關神經加速器的任何詳細技術信息。

然而,它將適合每個 GPU 中的着色器核心,因此神經性能應該根據特定 GPU 實現中着色器核心的數量進行擴展。Arm 的第五代設計可以從 5 個或更少的核心擴展到最多 16 個。

去年,這家芯片設計公司宣佈了其最新的升級技術——Arm Accuracy Super Resolution(Arm ASR)。該技術允許遊戲渲染較低分辨率的圖像,並應用算法進行升級,從而在保持質量的同時降低幀的處理成本。

爲了改善這一點,Arm 正在利用其加速器硬件驅動的神經超級採樣 (NSS),這使得每幀 4ms 內從 540p 分辨率升級到 1080p,與渲染全幀相比,可節省高達 50% 的 GPU 工作量,該公司聲稱。

“這是實時人工智能驅動的渲染。它速度更快,畫面更清晰,功耗更低。因此,NSS 可以用較低質量的輸入產生同等質量的輸出,也可以用相同的輸入產生更高質量的輸出。”諾斯說道。

如上所述,Arm 還在開發其他應用,包括神經幀率提升 (NFRU) 和神經超級採樣與降噪 (NSSD)。NFRU 旨在通過獲取一對連續幀並生成中間幀來提高幀率。

“神經網絡還與我們即將添加到 GPU 的新硬件緊密結合,以加速運動矢量的生成,從而追蹤像素在幀與幀之間的移動方式。這將使以 30 FPS 運行的內容能夠以非常低的成本升級到 60 FPS,”North 補充道。

NSSD 旨在實現全路徑光線追蹤所期望的圖像質量,諾斯表示,即使在桌面系統上,全路徑光線追蹤的計算成本也過於高昂。“但當你將路徑追蹤與神經網絡結合起來時,你實際上只需向場景中每個像素投射少量光線,然後你就可以利用神經技術將這些缺失的細節補回來。因此,神經網絡不僅能夠從相鄰像素推斷數據,還能從之前的幀推斷數據。”

實現這一切的是一個神經圖形開發套件,Arm 表示今天推出該套件是爲了讓遊戲開發者在硬件可用之前搶先集成 AI 圖形。

該套件包含虛幻引擎的插件,允許開發者“只需點擊幾下”即可將神經超級採樣融入遊戲中,並通過 GitHub 和 Hugging Face 以開放格式提供模型。此外,套件還提供了 Arm ML Vulkan 擴展的完整 PC 仿真,允許開發者在移動硬件準備就緒之前運行整個堆棧。

這並非神經技術首次被融入手機芯片。它已被廣泛用於驅動相機功能,而 Arm 授權方高通也一直在通過嵌入到其處理器中的神經處理單元 (NPU) 來提升其智能手機平臺的 AI 能力。

在去年的世界移動通信大會(MWC)上,Qualy展示了在安卓手機上運行的70億參數大型語言模型,併發布了面向開發者的AI Hub。

當被問及其最新技術是否可以用於其他目的時,North 表示,編程模型(Vulkan)是不同的,並且是圖形優先的,但並非只關注圖形,理論上可以用於某些推理。

他說:“我們非常興奮地看到人們用它做什麼。”

問題是,其他人會有同樣的熱情嗎?

https://www.theregister.com/2025/08/12/arm_bringing_neural_acceleration_to/