TPU 開賣、NPU 崛起 主權 AI 的「非輝達戰爭」正開啟
耐能智慧創辦人暨執行長劉峻誠。記者邱德祥/攝影
Google 開始對外販售自家 TPU,與此同時,中東多國積極部署主權 AI 基礎設施,採用包括 NPU 在內的多元架構,顯示去 NVIDIA 化的 AI 運算生態正逐步獲得關注,這一趨勢背後的關鍵驅動力,包括電力效率(節能)、部署彈性,以及地緣政治風險控管。
在 2025 年 ISC West 等展會上,耐能智慧(Kneron)展出了其第四代 NPU 晶片 KL730,能支援邊緣生成式 AI 本地化運行、多模態並行處理任務(如語音+視覺偵測等),並在功耗與效能上做優化,例如在 Transformer 型模型運行時,功耗減少約 40%,推理速度提升約 2 倍。
耐能是臺灣的一家 AI 晶片新創,創辦人劉峻誠除被認爲是早期在臺定義 NPU 架構者之一,耐能 NPU 已獲沙烏地阿拉伯 NTDP 支持,並參與德國主權 AI 計劃,顯示其低耗能、非雲端導向的技術特性,正逐漸被主權 AI 部署需求採用。
臺灣NPU晶片業者耐能,搶進中東德國主權AI
耐能專注於 NPU/邊緣 AI發展,不只是賣晶片及IP,也在系統整合、模組設計、應用落地上投入。例如支援 USB dongle、筆電及智慧裝置,也與工業物聯網(AIoT)、智能家電、車載、安防監控等場景合作。
如耐能與新漢 (NEXCOM) 集團策略合作,共同打造以 NPU 爲基礎的邊緣運算平臺與解決方案,針對智慧物聯網場景與垂直應用市場。
隨算力中心大量建置,GPU爲主的超級AI算力中心也因高耗電量及供應管制等諸多因素,使各國紛紛多角化選擇晶片規格,科技巨頭也開發自有晶片如TPU或NPU,近期Google開發的TPU晶片更盛傳將對外銷售,而類NPU陣營如耐能及Cerebras等晶片業者,也打入中東國家主權AI建置需求,顯示各國在美國晶片出口限制下,對於非訓練用途(如推論/邊緣 AI)逐步尋求去 NVIDIA 化的替代方案。
NPU是Neural Processing Unit的縮寫,也可稱神經網路處理器,是專門爲AI任務(特別是推理/部分訓練、邊緣 AI/多模態模型推理)設計的硬體加速器。
與 GPU 或 CPU 相比,NPU或以RISC-V技術開發AI晶片具有幾個潛在優勢:1.功耗與能效比(Performance per Watt),在低功耗/專用運算的情境中,比 GPU/通用運算單元更有效率,尤其是在邊緣設備(Edge Devices)或離線運算場景。
2.延遲與即時性:因爲能做本地推理/處理,避免因爲雲端/網路往返延遲,適合對即時性要求高的應用(語音命令、人員偵測、車載系統等)。
3.隱私與資料主權:資料不必上傳到雲端,可以在終端或本地處理,減少對外部管控/監控與法律/合規風險。
4.成本與基礎設施壓力:雲端 GPU 運算與冷卻/電力/網絡基礎設施需求非常高。若很多運算能轉移到更低功耗/更分散的 NPU 或邊緣運算,整體系統成本與資源耗用可降低。
不過,NPU 也有限制,包括通用性限制(通用大型模型或訓練需求仍常常需要 GPU/TPU/大型加速器)、開發生態限制(工具/框架/算法最佳化)、晶片製造成本與設計經驗挑戰高,因此耐能開發可重構的 NPU,期望兼顧性能與功耗平衡、支援邊緣多任務或多模態應用。
劉峻誠:臺灣產業應比別人:更早又更完整
累積多國主權AI標案經驗,劉峻誠受訪指出,耐能期望於扮演「臺灣的 NPU 定義者與邊緣 AI 實踐者」戰略角色,爲臺灣示範未來可以發展的產業方向:不只是做代工,而是從設計 IP、研發 NPU、加上模組與系統整合,甚至軟體+模型的端到端解決方案。
劉峻誠表示,若政府與產業政策能大力扶植這類整合能力,臺灣未來不只是算力代工中心,也能在架構與設計上發揮影響力,面對邊緣 AI 市場與需求爆發,許多國家與企業開始擔心雲端中心算力集中帶來的風險(隱私、資料主權、延遲、成本、能源消耗等)。邊緣 AI 與 NPU 正好對應這些痛點。
劉峻誠表示,臺灣的關鍵在於「比別人更早、更完整」推出低功耗可客製化的 NPU 解決方案,並達成技術自主、應用分散及韌性需求、低耗能與低環境成本、在主權 AI 陣營中佔有先手。
劉峻誠指出,臺灣NPU要能與 GPU 或國際領先 NPU/ASIC 媲美,需要高度設計經驗、EDA 工具支持、國內外 IP 與算法專家。耐能具備部分能力,但整體來說臺灣在某些核心設計(如最先進邊緣大型語言模型、高精度訓練電路、高帶寬記憶體與封裝)跟國際相比還有落差。
同時,也有許多國家正急起直追,如中國的 NPU 公司研發力量正在快速追趕;歐美與日韓也積極在此方向投入資源,由於NPU 的設計與驗證需要大量資本投入,並且量產成本、良率、封裝、測試都是需要高資本,若市場規模不足或訂單不穩定,就墊高投資風險。
因此,劉峻誠坦言未來NPU市場競爭勢必加劇,若臺灣不能持續在設計與架構創新上投入,健全相關生態系統與軟體工具鏈,臺灣就可能被其他國家在某些邊緣應用市場追上甚至取代。
更重要是政策與法規對相關先進晶片設計、IP 保護、出口管制、知識產權、能源法規等,給投入NPU開發的相關產業鏈業者稅收優惠或抵免誘因,提供本土市場邊緣 AI 應用(如智慧家電、車載系統、安防監控、醫療輔助裝置等)驗證場景,或公部門標案及公共基礎設施率先使用臺灣隊NPU /邊緣 AI 解決方案,以促進應用生態成長。
除中東案例,劉峻誠認爲,臺灣企業未來也可針對「願意或正在推動主權 AI/算力自主」的國家或地區(如歐盟、東南亞等)積極合作,他認爲,若臺灣能在政策上、資本上、基礎設施上支持,就有可能在新的 AI 世代中,不僅守住現有的半導體/代工強權地位,也擴展到設計與主權自主的階段。