DeepSeek出高招 跳脫輝達限制!爆恐改用大陸國產晶片
DeepSeek擺脫輝達CUDA限制,爲未來與大陸國產GPU晶片的相容性鋪路。(示意圖/達志影像/shutterstock)
大陸AI新創公司DeepSeek(深度求索)開發的AI大模型,繞過了美國巨頭輝達的CUDA(統一運算架構),這爲未來DeepSeek與大陸國產GPU晶片的相容性做好準備。
據快科技、Tom's Hardware報導,輝達開發的CUDA能大幅降低研發大模型的難度,並獲得全球開發商的廣泛應用,讓輝達在AI晶片領域穩居龍頭地位。然而,最新發現指出,DeepSeek在使用輝達H800晶片進行訓練時,採用的是輝達底層硬體指令PTX(Parallel Thread Execution)語言,而非高階編程語言CUDA。
PTX編程語言極其複雜且難以維護,因此業界通常偏向於使用CUDA等高級編程語言。
北京航空航天大學副教授黃雷表示,DeepSeek繞過CUDA意味着其能夠根據GPU驅動函數直接開發創新,以實現更精細的操作。
簡而言之,DeepSeek將優化提升至極致境界。
DeepSeek擁有擅長撰寫PTX語言的內部開發人員,如果未來改用大陸國產 GPU,DeepSeek將能更得心應手地處理硬體相容性問題。他們只要瞭解硬體驅動提供的基本函數介面,即可仿效輝達GPU硬體編程介面編寫相關程式,讓自家的AI模型更容易與大陸本土硬體兼容。