二度推遲發佈時間 技術障礙 DeepSeek R2難產
DeepSeek。圖/美聯社
DeepSeek-R2大模型市傳規格
中國人工智慧(AI)企業DeepSeek早先憑藉低成本、高效能震撼市場,如今新AI模型DeepSeek-R2大模型卻傳出「難產」。路透等外媒引述消息指出,在中國推進科技自主背景下,DeepSeek使用華爲晶片訓練失敗,因此二度推遲發佈時間,反映出中國本土取代美國技術的侷限性,並對中國AI產業整體發展節奏造成深遠影響。
綜合外媒報導,DeepSeek-R2是基於華爲升騰910B(Ascend 910B)晶片負載進行訓練,DeepSeek-R2的總參數量可能會達到1.2兆,較DeepSeek-R1的6,710億參數增加大約一倍。但是,市場並未等到原定於5月推出的R2大模型,理由是因技術與市場競爭而延遲,隨後再傳計劃於8月15日至30日期間發佈,但DeepSeek立刻否認上述時間,至今未有具體發表消息。
消息人士透露,華爲派出工程師團隊前往DeepSeek辦公室,以助使用其AI晶片開發R2模型,但即使華爲團隊在場,DeepSeek仍無法在升騰晶片上成功進行訓練。目前,DeepSeek與華爲的合作持續中,使該模型與升騰晶片相容進行推理。
在中美科技戰背景下,中國積極發展AI先進技術自主,而DeepSeek R2徹底擺脫美國AI晶片巨頭輝達(NVIDIA)技術,訓練全程皆未使用輝達顯卡,全部基於升騰910B晶片集羣平臺,故被視爲觀察中國AI技術進步的關鍵節點。
美國此前鬆綁輝達對中國特供版晶片H20出口限制,但卻傳中國政府近期約談騰訊、百度以及字節跳動等科技巨頭,瞭解其採購H20晶片的原因。
分析指出,雖然華爲升騰系列晶片被視爲替代輝達產品的重要選項,但在大規模AI模型訓練的穩定性和效率方面仍存在差距。
R2一再推遲暴露出中國AI產業在追求技術自主過程中的關鍵瓶頸,同時印證美國半導體出口管制對中國AI發展的實質影響。
市場關注,此次延遲會否影響DeepSeek的融資進程及商業化佈局,以及中國AI產業整體的發展節奏。