DeepSeek-R1官宣“小版本”升級細節,網友:讓我們叫它R2吧

5月29日消息,在官宣“小版本更新”並開源新模型之後。晚間,DeepSeek 終於官宣。

官方表示其旗下旗艦模型 DeepSeek-R1完成小版本更新,版本號升級爲 DeepSeek-R1-0528。新版本已在官網、App、小程序及 API 全面上線,用戶啓用“深度思考”功能後即可體驗。

本次升級,主要集中在模型的深度思考能力的強化、幻覺的改善,以及創意寫作方面。

官方表示,DeepSeek-R1-0528依舊基於 DeepSeek V3 Base 模型構建,但在後訓練階段投入更多算力,使其在數學、編程、邏輯推理等任務中表現大幅提升。

官方數據顯示,新版模型在複雜數學測評 AIME 2025中的準確率由原來的70% 提升至87.5%。平均每題推理使用 token 數從12K 提高到23K,顯著表明其在“深度思考”過程中的路徑更長、分析更細。

DeepSeek-R1-0528在各項評測集上均取得了優異表現

圍繞“思維鏈”技術,DeepSeek 還將 R1-0528的推理路徑蒸餾至 Qwen3-8B Base 模型,推出小模型 DeepSeek-R1-0528-Qwen3-8B,在 AIME 2024中表現超越 Qwen3-8B,逼近 Qwen3-235B,驗證了高質量推理鏈的通用性與遷移能力。

在文本生成方面,R1-0528優化了議論文、小說、散文等寫作能力,能輸出更長、更符合人類偏好的長篇內容。同時,幻覺率下降45~50%,在改寫、總結、理解等場景中輸出更爲精準。

此外,R1-0528還支持工具調用。在 Tau-Bench 測評中,其工具調用能力已與 OpenAI o1-high 相當。前端代碼生成、網頁開發、角色扮演等能力也都有更新。(袁寧)