☰

DeepSeek R2徹底擺脫輝達全數華爲晶片建構總參數提升1倍

今年初DeepSeek R1在全球的驚訝聲中誕生，美國AI界爲之震動，現在更強的新版本DeepSeek R2即將問世，預料會再次衝擊全球AI產業界。（圖／路透）

今年初DeepSeek R1在全球的驚訝聲中誕生，美國AI界爲之震動，當紅人工智慧晶片企業輝達（Nvidia）股價隨之暴跌。據陸媒報導，在大陸與全球AI競爭對手的高度關注下，更強的新版本DeepSeek R2即將面世。

據《快科技》引述AI市場最新爆料稱，DeepSeek R2大模型將採用更先進的混合專家模型（MoE），總參數量較前代R1提升約1倍，預計達1.2兆（R1總參數量爲6710億），單位推理成本較GPT-4大減，減幅高達驚人的97.4%。

報導導指出，由於中美科技戰、貿易戰愈演愈烈，輝達H20晶片面臨新一波出口管制。在DeepSeek R2預期發佈時間臨近的情況下，各界高度關注中國指標性AI大模型在缺乏美國晶片下的發展動向。

業界傳聞，DeepSeek R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當，還將結合更智慧的門控網路層（Gating Network），進而優化高負載推理任務的性能。

有消息指出，DeepSeek R2將徹底擺脫輝達晶片，訓練全程全部基於升騰910B（Ascend 910B）晶片集羣平臺，在FP16精度下，計算性能達到512每秒浮點運算，晶片利用率高達82%，整體性能約爲輝達A100集羣的91%。

市場預期，這項進展有望降低大陸對海外高端AI晶片的依賴，且華爲全新的升騰910C晶片也開始進入大規模量產階段。

在成本方面，DeepSeek-R2的單位推理成本較OpenAI旗下的GPT-4大減97.4%。其中，R2輸入每百萬個詞元僅需0.07美元，而輸出每百萬個詞元僅0.27美元。

分析人士認爲，R2若如傳聞般強勢，可能再次引發市場對AI基礎設施需求的質疑，加上華爲AI晶片的國產替代，將對輝達帶來更大影響。

DeepSeek R2徹底擺脫輝達 全數華爲晶片建構總參數提升1倍