☰

DeepSeek V3.1升級版上線具更高的思考效率

香港經濟日報引述DeepSeek微信公衆號發文指出，V3.1將實現一個模型同時支持思考模式與非思考模式，相較於其R1推理模型，V3.1的Think模式能在更短時間內給出答案。此外，通過「後訓練」優化，新模型在工具使用與智慧體任務中的表現有較大提升。

DeepSeek V3.1完成一項完整程式碼任務的成本僅1.01美元，卻達到市面上近70美元等值系統的成果，對每天使用AI工作的企業用戶來說，可節省數百萬美元成本。

該公司表示，經過思維鏈壓縮訓練後，V3.1-Think在輸出token數減少20％至50％的情況下，各項任務的平均表現與公司的R1-0528持平。此外，在搜索智慧體的多項測評中均取得較大提升，超過R1-0528。

目前，官方App與網頁端模型已同步升級至V3.1，DeepSeek的API（應用程序擴展接口）也同步升級，且上下文均已擴展爲128K，該模型現在能夠處理更多的訊息，並且擁有更強的記憶能力。

另一方面，外媒近日報導，基於華爲升騰（Ascend）910B晶片負載進行訓練的DeepSeek R2訓練失敗，導致R2已二度推遲發佈時間。儘管力求擺脫美國AI晶片龍頭輝達（NVIDIA）技術，但仍反映出中國本土取代美國技術的侷限性。

DeepSeek V3.1升級版上線 具更高的思考效率