DeepSeek-V3.1正式發佈 UE8M0 FP8技術助力國產芯片加速追趕

據DeepSeek官方公衆號消息,DeepSeek-V3.1正式發佈。DeepSeek在其官宣發佈DeepSeek-V3.1的文章中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數精度。DeepSeek官微在置頂留言裡表示,UE8M0 FP8是針對即將發佈的下一代國產芯片設計。

FP8是Float8的簡稱,即用8位二進制數表示浮點數,主要用於深度學習的訓練和推理。相比傳統的FP32(32位浮點數)或FP16(16位浮點數),FP8顯著降低了顯存佔用和計算資源需求,同時通過優化設計(如動態範圍調整)維持了較高的精度。‌‌FP8對國產芯片的使用效率提升顯著,將進一步縮小與NV芯片的效率/成本差距,大大增加國產芯片的可用性。

有機構指出,DeepSeek-V3.1 採用UE8M0 FP8 Scale,國產AI芯片-國產開源模型-下游應用,國產AI生態全方面閉環。當前國產AI芯片正處於技術突破與生態落地的關鍵窗口期,UE8M0 FP8助力國產芯片加速追趕。‌‌

據財聯社主題庫顯示,相關上市公司中:

和而泰持有摩爾線程1.244%股份。摩爾線程是首個支持原生FP8的國產GPU廠商,基於全新MUSA Compute Capability 3.1計算架構,可提供原生FP8計算能力。

芯原股份用於高性能Transformer推理的NPU芯原VIP9000支持FP8技術,能讓客戶在雲端完成FP8訓練後,直接快速部署到支持FP8的硬件中。