☰

DeepSeek傳年底前發表AI Agent

知情人士表示，DeepSeek正在構建的AI模型，希望在極少指示的情況下，代表用戶執行多步驟操作，同時還能根據先前的操作進行學習和改進。該知情透露，DeepSeek創辦人人樑文鋒正督促研發團隊在今年第四季推出新款軟體。

DeepSeek的R1大模型今年1月橫空出世以來，憑藉着多模態理解能力，加上遠低於美國同業的開發成本，引爆大陸科技行業熱潮。然而，面對中美競爭對手陸續推出新的模型，DeepSeek之後只推出一些小的升級，市場關注的R2大模型卻持續「難產」。

報導指出，DeepSeek目前正在開發的專注於代理功能的模型，反映出AI領域風向的轉變。OpenAI、Anthropic和微軟近幾個月都推出自己的代理功能軟體，以更流暢地執行個人和專業任務。與許多聊天機器人不同，這種新型服務並非用幾行簡潔的文字來回複用戶，而是可委以處理更復雜的任務。

DeepSeek在8月底新推出R1升級版V3.1，相較於R1模型，V3.1能在更短時間內給出答案。此外，通過「後訓練」優化，新模型在工具使用與智慧體任務中的表現有較大提升。

至於R2大模型遲未公佈，外媒稍早報導，DeepSeek R2利用華爲升騰（Ascend）910B晶片負載的訓練失敗，導致R2已二度推遲發表時間，至今未定。

相關資訊