DeepSeek R2徹底擺脫輝達 全數華爲晶片建構總參數提升1倍

今年初DeepSeek R1在全球的驚訝聲中誕生,美國AI界爲之震動,現在更強的新版本DeepSeek R2即將問世,預料會再次衝擊全球AI產業界。(圖/路透)

今年初DeepSeek R1在全球的驚訝聲中誕生,美國AI界爲之震動,當紅人工智慧晶片企業輝達(Nvidia)股價隨之暴跌。據陸媒報導,在大陸與全球AI競爭對手的高度關注下,更強的新版本DeepSeek R2即將面世。

據《快科技》引述AI市場最新爆料稱,DeepSeek R2大模型將採用更先進的混合專家模型(MoE),總參數量較前代R1提升約1倍,預計達1.2兆(R1總參數量爲6710億),單位推理成本較GPT-4大減,減幅高達驚人的97.4%。

報導導指出,由於中美科技戰、貿易戰愈演愈烈,輝達H20晶片面臨新一波出口管制。在DeepSeek R2預期發佈時間臨近的情況下,各界高度關注中國指標性AI大模型在缺乏美國晶片下的發展動向。

業界傳聞,DeepSeek R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當,還將結合更智慧的門控網路層(Gating Network),進而優化高負載推理任務的性能。

有消息指出,DeepSeek R2將徹底擺脫輝達晶片,訓練全程全部基於升騰910B(Ascend 910B)晶片集羣平臺,在FP16精度下,計算性能達到512每秒浮點運算,晶片利用率高達82%,整體性能約爲輝達A100集羣的91%。

市場預期,這項進展有望降低大陸對海外高端AI晶片的依賴,且華爲全新的升騰910C晶片也開始進入大規模量產階段。

在成本方面,DeepSeek-R2的單位推理成本較OpenAI旗下的GPT-4大減97.4%。其中,R2輸入每百萬個詞元僅需0.07美元,而輸出每百萬個詞元僅0.27美元。

分析人士認爲,R2若如傳聞般強勢,可能再次引發市場對AI基礎設施需求的質疑,加上華爲AI晶片的國產替代,將對輝達帶來更大影響。