DeepSeek推新版R1 稱表現直逼美國頂尖模型

DeepSeek崛起。(圖/路透)

大陸AI新創公司DeepSeek發表其熱門推理模型R1的首次更新版本,並指出新版R1模型深度思考能力得到強化,整體表現上已接近美國競爭對手OpenAI和谷歌推出的頂尖模型。

聯合早報報導,DeepSeek於29日晚間在微信公衆號發文指出,DeepSeek R1模型已完成小版本升級,目前版本爲DeepSeek-R1-0528。

文章顯示,DeepSeek-R1-0528仍使用,2024年12月所發表的DeepSeek V3 Base模型作爲基礎,但在後訓練過程中投入更多算力,顯著提升模型的思維深度與推理能力。相較於舊版R1,新版模型在複雜推理任務中的表現顯著提升。

文章特別提到,更新後的R1模型對「幻覺」問題(錯誤或誤導性輸出)進行優化,在改寫潤飾、總結摘要、閱讀理解等情境中,幻覺率降低45%至50%左右。其他方面的提升則包括更貼近人類偏好的創意寫作,和更好的前端程式碼生成、角色扮演能力。