DeepSeek發佈新論文,機構稱DeepSeek推動AI算力需求大量增長
據媒體報道,2月18日,DeepSeek在社交平臺X上發佈了一篇關於NSA的純技術論文報告。DeepSeek稱,NSA是一種與硬件一致且本機可訓練的稀疏注意力機制,用於超快速的長上下文訓練和推理。通過針對現代硬件的優化設計,NSA加快了推理速度,同時降低了預訓練成本,而不會影響性能。在一般基準測試、長上下文任務和基於指令的推理上,它的表現與完全注意力模型相當甚至更好。
民生證券表示,DeepSeek等頭部模型的發展讓AI應用、AIAgent等加速落地,使用量快速提升推動AI算力需求進入從訓練推動到推理推動的拐點,Deepseek或是算力星辰大海的一朵“小浪花”。從微信等頭部APP接入DeepSeek後可以看到,國民級應用模型使用持續放大算力需求,進而帶來推理等算力需求的大量增長,算力行業迎來重要發展機遇。
本文源自:金融界