華爲晶片輸了? 爆DeepSeek新模型延遲 還是得要輝達
深度求索(DeepSeek)因爲採用的華爲晶片訓練失敗而推遲發佈最新模型,這也凸顯北京當局力爭取代美國技術所面臨的限制。(路透社)
路透引述英國《金融時報》14日報導,中國人工智慧(AI)新創公司深度求索(DeepSeek)因爲採用的華爲晶片訓練失敗而推遲發佈最新模型,這也凸顯北京當局力爭取代美國技術所面臨的限制。
DeepSeek在1月發佈其R1模型後,引發全球轟動。先前就有消息指出,DeepSeek的最新AI模型將採用華爲的升騰(Ascend)處理器,而非輝達(NVIDIA)晶片。港媒數月前曾報導,華爲擬於今年開始量產最先進AI晶片升騰910C,旨在與輝達生產的晶片較勁。
本週稍早有消息指出,DeepSeek將於本月中下旬發表新模型DeepSeek-R2,爲要與OpenAI新一代AI模型GPT-5互較高低。
不過根據知情人士透露,DeepSeek在使用Ascend晶片進行R2訓練的過程中遭遇持續性的技術問題,促使該公司採用輝達晶片進行訓練,使用華爲晶片進行推理。