DeepSeek官方詳解R1更新:加碼後訓練,思維深度與推理能力大幅提升

藍鯨新聞5月29日訊 5月29日,在前一天低調釋出小版本升級的R1模型後,DeepSeek官方最新介紹稱,當前版本爲DeepSeek-R1-0528。該版本仍然使用2024年12月所發佈的DeepSeek V3 Base模型作爲基座,但在後訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。在數學、編程與通用邏輯等多個基準測評中,更新後的R1模型表現接近OpenAI o3、Gemini-2.5-Pro等國際頂尖模型。同時在幻覺改善、創意寫作、工具調用等領域的能力均有更新和提升。(藍鯨新聞 朱儁熹)