DeepSeek V3.1免費上線官網和App 回答更快
今日,深度求索宣佈DeepSeek-V3.1正式發佈。經查,目前新版模型已經默認同步上線官網、App,面向C端用戶完全免費。
據介紹,DeepSeek-V3.1具備128K超長上下文處理能力,支持混合推理架構(一個模型同時支持思考模式與非思考模式)。
此外,新版模型擁有更高的思考效率,相比R1能在更短時間內給出答案。
不僅如此,DeepSeek-V3.1擁有更強的Agent(智能體)能力,通過Post-Training(後訓練)優化,新模型在工具使用與智能體任務中的表現有較大提升。
比如,在代碼修復測評SWE與命令行終端環境下的複雜任務(Terminal-Bench)測試中,以及在需要多步推理的複雜搜索測試(browsecomp)與多學科專家級難題測試(HLE)上,DeepSeek-V3.1均大幅領先DeepSeek-R1-0528。
另外,DeepSeek-V3.1思考效率提升有了巨幅提升。經過思維鏈壓縮訓練後,V3.1-Think在輸出token數減少20%-50%的情況下,各項任務的平均表現與R1-0528 持平。
對於DeepSeek R2發佈延遲的原因,DeepSeek總結稱,主要由於採用國產昇騰芯片進行訓練時遇到技術挑戰,以及公司對模型質量的高標準要求。雖然之前有8月發佈的傳聞,但已被官方否認。目前看來,我們可能需要再等待幾周的時間,但具體日期還需以官方消息爲準。