☰

徹底擺脫輝達？傳DeepSeek R2於5月發布全部用華為晶片

市場傳出陸企「深度求索」更強的新版本「DeepSeek R2」大模型將於5月面世，將徹底擺脫輝達晶片，全部基於華爲升騰910B（Ascend 910B）晶片。路透

年初陸企深度求索的DeepSeek R1大模型的問世撼動美國AI圈，甚至引發輝達的股價暴跌。在大陸與全球AI競爭對手的高度關注下，市場傳出更強的新版本DeepSeek R2即將在5月面世，將徹底擺脫輝達晶片，全部基於華爲升騰910B（Ascend 910B）晶片。

快科技報導，市場最新爆料，R2大模型將採用更先進的混合專家模型（MoE），總參數量較前代R1提升約1倍，預計達1.2兆（R1總參數量爲6710億），單位推理成本較GPT-4大減97.4%。

當下，中國大陸與美國科技戰、貿易戰愈演愈烈，輝達H20晶片面臨新一波出口管制。在DeepSeek R2預期發佈時間臨近的情況下，各界高度關注大陸指標性的大模型，在缺乏美國晶片資源下的發展動向。

據傳，R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當，還將結合更智慧的門控網路層（Gating Network），進而優化高負載推理任務的性能。

消息指出，R2將徹底擺脫輝達晶片，訓練全程均未使用輝達顯卡，全部基於華爲的升騰910B（Ascend 910B）晶片集羣平臺，在FP16精度下，計算性能達到512 PetaFLOPS，晶片利用率高達82%，整體性能約爲NVIDIA上一代A100集羣的91%。

市場預期，這將降低大陸對海外高端AI晶片的依賴，且華爲全新的升騰910C晶片，也開始進入大規模量產階段。

成本方面，DeepSeek-R2的單位推理成本，較OpenAI旗下的GPT-4大減97.4%。其中，R2輸入每百萬個字元僅需0.07美元，而輸出每百萬個字元僅0.27美元。

分析認爲，R2若如傳聞般強勢，可能再次引發市場對AI基礎設施需求的質疑，加上使用華爲AI晶片的國產替代，將對輝達帶來更大影響。

徹底擺脫輝達？傳DeepSeek R2於5月發布 全部用華為晶片