這種 AI 模型崛起 讓輝達競爭對手逮到機會
隨着DeepSeek R1等「推理」模型崛起,輝達AI晶片主宰地位可能面臨挑戰。路透
在DeepSeek加速改變人工智慧(AI)的運算要求之後,輝達(Nvidia)的挑戰者正抓緊一個新機會,試圖打破輝達在AI晶片領域的壟斷地位。
DeepSeek推出的R1語言模型,以及其他所謂的「推理式」AI模型,例如OpenAI的o3模型,及Anthropic公司的Claude 3.7模型等,在用戶要求「推理」時,所耗費的運算資源都比原本的AI系統要來得多。
此一現象已顛覆了AI運算需求的焦點。之前運算需求一直聚焦於模型訓練,或是建立模型,但現在隨着個人與企業對AI應用的需求增加,「推理」佔AI需求的比重料將上升。想要攪亂輝達市場地位的競爭對手,目前就把精力集中在這個領域。
Cerebras系統公司執行長費爾德曼表示,「訓練產生AI,推理運用AI。AI使用率已一飛沖天。現在製造推理用晶片的機遇遠優於大型的訓練晶片」。
輝達壟斷大型數據中心所需的晶片,例如馬斯克的xAI中心,以及OpenAI與軟體銀行的Stargate計劃等;但現在輝達投資人想確定的是,如果是正在興建的「推理式」小型資料中心,輝達是否也能賣贏競爭對手。
OpenAI旗下o3及DeepSeek R1等推理模型運算資源需求較高,可望爲輝達競爭對手的GPU帶來商機。美聯社
雲端供應業者Together AI共同創辦人普拉卡西表示,「推理」是該公司業務的「一大焦點」;「我相信到某一時點,大規模推理將成爲網路上的最大工作負擔」。
摩根士丹利分析師預估,未來幾年內美國資料中心的電力與運算需求之中,75%以上將屬於「推理」類型。這意味着未來幾年如果AI使用率仍以目前的速度持續成長,則可能有數千億美元的投資流向「推理式」AI設施。
巴克萊銀行分析師也預期,未來兩年內最大且最先進的「前沿AI」系統中,「推理」類的資本支出將超過「訓練」;預估2025年爲1,226億美元,2026年大幅增加到2,082億美元。儘管輝達預料仍將掌握前沿AI訓練100%市場,但從「長期」來看,輝達在「推理」運算市場的佔有率將僅有50%;預估到2028年時,輝達的競爭對手將能擁有近2,000億美元的市場。
輝達執行長黃仁勳堅信,該公司晶片用於推理和用於訓練一樣強。輝達最新推出的Blackwell晶片在設計上更適合用於推理,許多早期用戶也正把新晶片用於推理而非訓練。輝達Cuda軟體備受AI開發商歡迎,對競爭而言也是一道可怕的障礙。黃仁勳2月在財報說明會上表示,「推理式運算的需求量已經增加百倍以上,而且這才只是個開始」。
DeepSeek的v3與R1兩種語言模型推出後,已使推理成本進一步下降。在此同時,由於推理工作對運算力的要求遠高於AI訓練,也爲其他晶片業者生產的繪圖處理器(GPU)打開了一扇大門。
費爾德曼表示,硬體處理「推理」的效率,繫於從記憶體中存取資料的速度,速度是爭取用戶的關鍵。
法國新創企業Mistral就使用Cerebras的晶片,來提高聊天機器人Le Chat的效率。費爾德曼說:「Le Chat模型有時只要1秒就能產生答案,而OpenAI的o1模型則要花40秒。」
輝達指出,該公司的晶片過去兩年來「推理」效率已提升200倍。黃仁勳表示,「我們的架構能夠轉換,而且在所有這些領域都好用」。
但相較於輝達的「通用」GPU,專門針對特定推理式模型的GPU晶片,在操作效率上最佳。專家預期,未來幾年GPU晶片將進入一場大混戰。