AI教主黃仁勳 OpenAI一兆神預言 輝達轉型AI基礎供應商

Nvidia產品規劃上,從Blackwell系列到明年要推出的Rubin和Rubin CPX,以及將推出的Vera Rubin產品,正是Nvidia一步步轉型到AI基礎設施全套供應商;這套AI升級規模,是黃仁勳眼中真正的機遇所在。

文/魏聖峰

輝達(Nvidia)執行長黃仁勳日前接受網路媒體專訪時開宗明義地指出,我們正在經歷需求的深度和需求的廣度,這兩個指數等級的成長,會使得總計算需求的指數呈現爆炸性成長。這是黃仁勳認爲,未來AI需求的成長模式,並支持Nvidia估值的核心價值。面對這樣的需求,Nvidia正在部署一個AI生態系的計劃,讓競爭者追不上來。未來數據中心瓶頸是電力和土地,在AI時代,智慧能被以Token方式被量化、被定價,成爲像水和電一樣可以被生產與消費的商品。

在Nvidia產品規劃上,目前Blackwell系列產品B100、B200和GB300機櫃正大量出貨,預計明年要推出Rubin和Rubin CPX系列產品,二六年將要推出Vera Rubin,目前Vera Rubin平臺的六款晶片已經在完成設計定案(tape-out)。Blackwell系列產品屬於單一機櫃,接下來的Rubin架構平臺是好幾個機櫃組成的一個資料中心,且所有機構都要被串聯來產生算力。至於Vera Rubin平臺則是由好幾個資料中心組成的一臺超級電腦,不但每個機櫃都要串聯,不同的資料中心也需要串聯在一起。這就是黃仁勳在訪談中強調的AI工廠概念。由好幾個資料中心串連成的超級電腦,可算是一臺超級電腦。其所堆砌而成的算力,是單一資料中心的好幾十倍以上。這樣的算力才能因應AI指數等級的需求成長。

算力升級無極限

黃仁勳認爲,AI計算是一種全新思維,他承認單一GPU有極限,以AI計算的加速計算,就是擁有數千個核心繫統的超大型GPU,可以同時進行大量的運算,並能處理極耗費資源的特定任務,可以同時進行大量運算,讓整個系統的效率呈現指數等級的提升。這樣的替代規模,才他眼中真正的機遇所在。如果對照上述Nvidia產品推出進度,Blackwell和Rubin架構產品屬於一般的GPU,還不能發揮最大效能來產生需要的算力,Vera Rubin架構才比較能符合未來能因應AI指數型需求成長的平臺。

現在能生產AI晶片架構的公司,包括Nvidia、超微、英特爾和博通在內,在黃仁勳眼中僅屬於能運作通用計算的目的,雖然靈活也能處理各項任務,但還沒一項都能做到極致。唯有把通用計算全面升級到加速運算,才能解決過去十幾年我們依賴摩爾定律的物理極限。Nvidia的市場,正是對現存的基礎設施,進行一場全面的升級替換。這場替換規模,纔是他眼中真正的機遇所在。

對Meta、谷歌等資料中心巨頭來說。升級到AI不是一個選項,而是一場生存之戰,如果你的演算法讓用戶停留時間比對手少十%,你就輸了。在各大資料中心都在全力爭奪用戶時間的競賽中,沒有人敢在算力的提升上落後給對手。

面對Meta、谷歌和亞馬遜等資料中心巨頭自己研發的客製化ASIC晶片,以降低對Nvidia AI晶片的依賴,還能降低營運成本等。面對這樣的局勢,Nvidia是否還能維持現有的霸主地位?對此,黃仁勳認爲,競爭對手頭一開始就搞錯戰場,這場戰爭的核心從來都不是關於哪塊晶片比較便宜,而是在於哪座AI工廠更賺錢。Nvidia現在做的事已經不是那一顆晶片更好,而是在設計與建造一座AI工廠。如果從黃仁勳擘劃的「Nvidia護城河」來看,Nvidia已經把競爭對手AI晶片製造商擴大到亞馬遜、谷歌,甚至於高通和蘋果都是潛在的競爭對手。這代表Nvidia正在籌設一座AI等級的資料中心,而這類的AI資料中心的效能,比現有傳統資料中心業者效能大上十幾倍甚至上百倍。意味着Nvidia要從打造AI零組件一直做到建造一座AI工廠。

讓AI工廠更賺錢纔是重點

這座AI工廠不僅包含GPU,還有CPU、NVLink(高速連結)、Spectrum-X(網路技術)和CUDA(軟體平臺)。Nvidia還提供極致協同設計的策略,就是幫客戶每年同時升級這座AI工廠的所有部分,讓客戶每年都能與Nvidia的最佳等級AI平臺同步更新,以追求整體效率最大化。基於這樣的整體作戰能力,Blackwell系統就比前一代Hopper,性能實現三○倍的躍升能力。這等於是建構很難讓競爭對手追上來的護城河。(全文未完)

全文及圖表請見《先探投資週刊2373期精彩當期內文轉載》