R2沒等來,DeepSeek V3.1模型發佈:價格漲了,智能體能力加強

《科創板日報》8月21日訊(記者 黃心怡)在OpenAI發佈GPT-5模型14天后,樑文鋒終於出招了,新模型版本DeepSeek-V3.1正式發佈。

本次升級的核心亮點是採用了混合推理架構,允許模型在一個統一框架內支持“思考”與“非思考”兩種模式,實現了DeepSeek-R1和DeepSeek-V3的合體。

此外,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數精度,而UE8M0 FP8是針對即將發佈的下一代國產芯片設計。

DeepSeek同步升級了API接口,將上下文窗口擴展至128K,並新增了對Anthropic API格式的支持以簡化遷移。

在技術與產品更新之外,DeepSeek的API接口調用價格有所上漲,並取消夜間優惠。從北京時間2025年9月6日凌晨起,自北京時間2025年9月6日凌晨起,輸入價格方面,緩存命中時爲0.5元/百萬tokens,緩存未命中時則漲至4元/百萬tokens(此前V3爲2元/百萬tokens);輸出價格調整爲12元/百萬tokens(此前V3爲8元/百萬tokens)。。

混合推理架構已成爲大模型領域的一大趨勢。除了DeepSeek外,此前發佈的阿里通義千問Qwen3、GPT-5也都把推理模型與非推理模型進行融合。

不過,這類混合推理架構的實際效果仍有待觀察。在GPT-5模型發佈後,爲了平息用戶爭議,OpenAI已將 GPT-4o 已重新上線。

而DeepSeek-V3.1發佈後,《科創板日報》記者也看到不少用戶反饋稱,在體驗了DeepSeek-V3.1的推理能力後,更習慣DeepSeek R1的回答。

IDC中國研究總監盧言霞對《科創板日報》表示,思考與非思考模式的融合可以說是必然的趨勢,也是大模型發展史上的一個小迭代。“DeepSeek V3.1並非大版本,更值得期待的是大版本更新,但不知道何時。”

談及基礎模型的迭代速度,盧言霞表示,目前看確實有所放緩。“未來變革式的突破是不可預測的 就像創新不可被計劃,這使得迭代放緩。但何時能大突破,也難以預測。”

開放傳神(OpenCSG)聯合創始人陳冉也認爲,DeepSeek-V3.1綜合看來在預期以下。“效率確實有提升,但突破較少。”

值得一提的是, 深度求索正式發佈DeepSeek-V3.1後,稱其爲“邁向Agent(智能體)時代的第一步”。 DeepSeek-V3.1具有更智能的工具調用能力,可以支持多種Code Agent框架,開發者可以自己搭建智能體。

“Agent方向支持,看來是DeepSeek重點方向。”陳冉分析。

目前,大模型廠商已經紛紛將重點放在了智能體的應用上,今年 7 月,月之暗面發佈了擁有萬億參數規模的混合專家(MoE)模型。在其官方演示案例中, Kimi K2 邁出了智能體化的一步,可幫助用戶直接制定旅行計劃並預訂機票和酒店。

而智譜 AI 在 7 月 28 日發佈的 GLM-4.5 系列,也定位爲 "Agent 原生基礎模型 ",並在 8 月 20 日發佈了全球首個手機 Agent(智能體)AutoGLM2.0,可以幫助用戶 Agent 代理操作,具備推理、代碼與多模態的全能能力,比如可以一鍵訂票、訂咖啡。

此次DeepSeek則稱其在智能體能力方面實現了突破。編程智能體方面,在代碼修復測評SWE與命令行終端環境下的複雜任務(Terminal-Bench)測試中,DeepSeek-V3.1相比前代模型有顯著進步,所需輪數更少。

在搜索智能體測評方面,在需要多步推理的複雜搜索測試(browsecomp)與多學科專家級難題測試(HLE)上,DeepSeek-V3.1 性能已大幅領先 R1-0528。

有業內人士對《科創板日報》記者表示,今年屬於智能體元年,在探索中發現很多挑戰,也在逐步落地。“到明年的話或許會迎來真正的爆發年,隨着標杆案例的成熟,預計將達到規模化發展。”

隨着基礎大模型迭代的放緩,未來國產大模型的競爭或也將圍繞智能體等場景落地而展開。