☰

DeepSeek-R1官宣“小版本”升級細節，網友：讓我們叫它R2吧

5月29日消息，在官宣“小版本更新”並開源新模型之後。晚間，DeepSeek 終於官宣。

官方表示其旗下旗艦模型 DeepSeek-R1完成小版本更新，版本號升級爲 DeepSeek-R1-0528。新版本已在官網、App、小程序及 API 全面上線，用戶啓用“深度思考”功能後即可體驗。

本次升級，主要集中在模型的深度思考能力的強化、幻覺的改善，以及創意寫作方面。

官方表示，DeepSeek-R1-0528依舊基於 DeepSeek V3 Base 模型構建，但在後訓練階段投入更多算力，使其在數學、編程、邏輯推理等任務中表現大幅提升。

官方數據顯示，新版模型在複雜數學測評 AIME 2025中的準確率由原來的70% 提升至87.5%。平均每題推理使用 token 數從12K 提高到23K，顯著表明其在“深度思考”過程中的路徑更長、分析更細。

DeepSeek-R1-0528在各項評測集上均取得了優異表現

圍繞“思維鏈”技術，DeepSeek 還將 R1-0528的推理路徑蒸餾至 Qwen3-8B Base 模型，推出小模型 DeepSeek-R1-0528-Qwen3-8B，在 AIME 2024中表現超越 Qwen3-8B，逼近 Qwen3-235B，驗證了高質量推理鏈的通用性與遷移能力。

在文本生成方面，R1-0528優化了議論文、小說、散文等寫作能力，能輸出更長、更符合人類偏好的長篇內容。同時，幻覺率下降45~50%，在改寫、總結、理解等場景中輸出更爲精準。

此外，R1-0528還支持工具調用。在 Tau-Bench 測評中，其工具調用能力已與 OpenAI o1-high 相當。前端代碼生成、網頁開發、角色扮演等能力也都有更新。（袁寧）

相關資訊