《產業》北美CSP擴大AI部署 2026年推論算力估增1.2倍

TrendForce預估,2026年AI伺服器出貨將年增逾28%,以高階AI訓練機種佔約55%爲主,但中長期成長將改由AI推論機種主導,主因CSP將積極推展AI應用以加速實現AI雲端服務商用化,且輝達(NVIDIA)將拓展更多AI推論方案或使用情境。

TrendForce估算,Google、Amazon、Microsoft、Meta與Oracle等北美五大CSP的2026年合計資本支出將超過7700億美元、年增近87%。若以FP16/BF16爲基礎估算AI訓練能力,五大業者2025年總算力已超過9 ExaFLOPS,2026年將續揚逾56%。

AI推論方面,若以FP4/NVFP4運算效能爲基準估算,2025年五大CSP的總算力逾37 ExaFLOPS,預計2026年將大增近1.22倍,顯著高於AI訓練,反映出輝達此次軟硬體系統調校特別着重AI推論效能,並落實在新一代的GB300、VR200整櫃式方案中。

除了GPU方案,CSP業者同步推進自研客製化晶片(ASIC)整櫃產品,以Google佈局最積極,TrendForce預估2026年自家TPU晶片需求量將年增近80%,並在下半年逐步升級至v8世代。Amazon的Trainium自研ASIC系列今年於自家AI伺服器的佔比將逾40%。

TrendForce表示,輝達、超微(AMD)和CSP自研ASIC的新世代機櫃皆整合液冷散熱系統,有助降低AI伺服器機架U數、提高單一機櫃可容納的加速器數量。在單顆AI GPU或ASIC的熱設計功耗(TDP)同步提高下,AI伺服器系統功耗呈結構性放大。

據TrendForce估算,2023年北美五大CSP的伺服器功耗合計年增2.8GW,至2026年躍升至18GW,年增率高達1.16倍,主因爲AI競賽白熱化,及輝達GB300、超微Helios和CSP自研ASIC平臺同步放量。