DeepSeek新模型 陸企秒上線
財聯社引述DeepSeek指出,得益新模型服務成本的大幅降低,官方API價格也相應下調,新價格即刻生效。新價格政策下,開發者調用DeepSeek API成本將降低50%以上。大陸國產晶片深度協同有望全面受益,「晶片-架構-模型」的協同創新,打破傳統AI生態中硬體與軟體的割裂。
DeepSeek-V3.2-Exp發佈後,華爲升騰快速基於vLLM/SGLang等推理架構完成適配部署,實現0day支持,並面向開發者開源。華爲雲也完成適配,最大可支援160K長序列上下文長度。目前該模型已正式上架華爲雲大模型即服務平臺MaaS,爲企業及開發者提供模型體驗和API服務。
寒武紀同步宣佈適配,並開源vLLM-MLU推理引擎原始程式碼,依託自研BangC融合運算子與Triton架構達成「計算與通信並行」的極致性能優化。
此外,海光信息DCU實現無縫適配+深度調優,做到大模型算力「零等待」。海光表示,基於GPGPU架構強大的生態優勢,與程式設計開發軟體棧DTK的特性,新模型在海光DCU上展現出優異的性能,同時驗證海光DCU高通用性、高生態相容度及自主可控的技術優勢。
分析認爲,DeepSeek-V3.2最大的意義在於軟硬協同設計支持大陸國產算力,全新DSA機制加上國產晶片的計算效率,大幅降低長序列場景下的訓推成本,共同爲客戶提供極具競爭力的軟硬體解決方案。