DeepSeek R2有望8月下旬發佈?內部人士:不屬實
近日有市場傳言稱,國產大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期間發佈。
8月13日,DeepSeek內部人士向澎湃新聞記者表示,上述消息不屬實。
早在今年4月,就有傳言稱,深度求索可能將在5月推出下一代AI大模型DeepSeek-R2。當時有報道稱,DeepSeek-R2大模型將會採用一種更先進的混合專家模型(MoE),其結合更加智能的門控網絡層(Gating Network)以優化高負載推理任務的性能。
不過,上述內部人士曾向記者坦言,該傳言真實度不高。
此後,DeepSeek官宣推出R1新版本,業內普遍認爲這是取代了R2的發佈。
5月29日,據DeepSeek公告,DeepSeek R1模型已完成小版本升級,當前版本爲DeepSeek-R1-0528。用戶通過官方網站、APP或小程序進入對話界面後,開啓“深度思考”功能即可體驗最新版本。API也已同步更新,調用方式不變。
公告指出,DeepSeek-R1-0528使用2024年12月所發佈的DeepSeek V3 Base模型作爲基座,但在後訓練過程中投入了更多算力,顯著提升模型的思維深度與推理能力。更新後的R1模型在數學、編程與通用邏輯等多個基準測評中取得當前國內所有模型中首屈一指的優異成績,並且在整體表現上已接近其他國際頂尖模型,如o3與Gemini-2.5-Pro。
相較於舊版R1,新版模型在複雜推理任務中的表現有顯著提升。例如在AIME2025測試中,新版模型準確率由舊版的70%提升至87.5%。這一進步得益於模型在推理過程中的思維深度增強:在AIME2025測試集上,舊版模型平均每題使用12K tokens,而新版模型平均每題使用23Ktokens,表明其在解題過程中進行了更爲詳盡和深入的思考。
大模型行業的內卷正在加劇。7月31日,據國際開源社區Hugging-Face最新趨勢熱榜顯示,前十名模型中,有9個是國產大模型,其中排名第一的是智譜最新發布的新一代旗艦大模型GLM-4.5,排名第二的是阿里旗下通義千問模型Qwen3,而騰訊混元最新發布的3D模型則排行第三。
但據排名數據顯示,DeepSeek R1在Hugging-Face趨勢熱榜中並不靠前,不過其依然是目前點贊最多的大模型,DeepSeek R1收到了1.25萬個贊(like),遠超其他國產大模型。
在年初成爲大模型產業王炸黑馬後,DeepSeek成爲國內大模型廠商的集體競標對手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了對標DeepSeek的目標,且在更新迭代上進展迅速。作爲中國開源大模型的“風向標”,DeepSeek正在面臨更激烈競爭。