☰

這種 AI 模型崛起讓輝達競爭對手逮到機會

隨着DeepSeek R1等「推理」模型崛起，輝達AI晶片主宰地位可能面臨挑戰。路透

在DeepSeek加速改變人工智慧（AI）的運算要求之後，輝達（Nvidia）的挑戰者正抓緊一個新機會，試圖打破輝達在AI晶片領域的壟斷地位。

DeepSeek推出的R1語言模型，以及其他所謂的「推理式」AI模型，例如OpenAI的o3模型，及Anthropic公司的Claude 3.7模型等，在用戶要求「推理」時，所耗費的運算資源都比原本的AI系統要來得多。

此一現象已顛覆了AI運算需求的焦點。之前運算需求一直聚焦於模型訓練，或是建立模型，但現在隨着個人與企業對AI應用的需求增加，「推理」佔AI需求的比重料將上升。想要攪亂輝達市場地位的競爭對手，目前就把精力集中在這個領域。

Cerebras系統公司執行長費爾德曼表示，「訓練產生AI，推理運用AI。AI使用率已一飛沖天。現在製造推理用晶片的機遇遠優於大型的訓練晶片」。

輝達壟斷大型數據中心所需的晶片，例如馬斯克的xAI中心，以及OpenAI與軟體銀行的Stargate計劃等；但現在輝達投資人想確定的是，如果是正在興建的「推理式」小型資料中心，輝達是否也能賣贏競爭對手。

OpenAI旗下o3及DeepSeek R1等推理模型運算資源需求較高，可望爲輝達競爭對手的GPU帶來商機。美聯社

雲端供應業者Together AI共同創辦人普拉卡西表示，「推理」是該公司業務的「一大焦點」；「我相信到某一時點，大規模推理將成爲網路上的最大工作負擔」。

摩根士丹利分析師預估，未來幾年內美國資料中心的電力與運算需求之中，75%以上將屬於「推理」類型。這意味着未來幾年如果AI使用率仍以目前的速度持續成長，則可能有數千億美元的投資流向「推理式」AI設施。

巴克萊銀行分析師也預期，未來兩年內最大且最先進的「前沿AI」系統中，「推理」類的資本支出將超過「訓練」；預估2025年爲1,226億美元，2026年大幅增加到2,082億美元。儘管輝達預料仍將掌握前沿AI訓練100%市場，但從「長期」來看，輝達在「推理」運算市場的佔有率將僅有50%；預估到2028年時，輝達的競爭對手將能擁有近2,000億美元的市場。

輝達執行長黃仁勳堅信，該公司晶片用於推理和用於訓練一樣強。輝達最新推出的Blackwell晶片在設計上更適合用於推理，許多早期用戶也正把新晶片用於推理而非訓練。輝達Cuda軟體備受AI開發商歡迎，對競爭而言也是一道可怕的障礙。黃仁勳2月在財報說明會上表示，「推理式運算的需求量已經增加百倍以上，而且這才只是個開始」。

DeepSeek的v3與R1兩種語言模型推出後，已使推理成本進一步下降。在此同時，由於推理工作對運算力的要求遠高於AI訓練，也爲其他晶片業者生產的繪圖處理器（GPU）打開了一扇大門。

費爾德曼表示，硬體處理「推理」的效率，繫於從記憶體中存取資料的速度，速度是爭取用戶的關鍵。

法國新創企業Mistral就使用Cerebras的晶片，來提高聊天機器人Le Chat的效率。費爾德曼說：「Le Chat模型有時只要1秒就能產生答案，而OpenAI的o1模型則要花40秒。」

輝達指出，該公司的晶片過去兩年來「推理」效率已提升200倍。黃仁勳表示，「我們的架構能夠轉換，而且在所有這些領域都好用」。

但相較於輝達的「通用」GPU，專門針對特定推理式模型的GPU晶片，在操作效率上最佳。專家預期，未來幾年GPU晶片將進入一場大混戰。

這種 AI 模型崛起 讓輝達競爭對手逮到機會

相關資訊

這種 AI 模型崛起讓輝達競爭對手逮到機會