DeepSeek傳年底前發表AI Agent
知情人士表示,DeepSeek正在構建的AI模型,希望在極少指示的情況下,代表用戶執行多步驟操作,同時還能根據先前的操作進行學習和改進。該知情透露,DeepSeek創辦人人樑文鋒正督促研發團隊在今年第四季推出新款軟體。
DeepSeek的R1大模型今年1月橫空出世以來,憑藉着多模態理解能力,加上遠低於美國同業的開發成本,引爆大陸科技行業熱潮。然而,面對中美競爭對手陸續推出新的模型,DeepSeek之後只推出一些小的升級,市場關注的R2大模型卻持續「難產」。
報導指出,DeepSeek目前正在開發的專注於代理功能的模型,反映出AI領域風向的轉變。OpenAI、Anthropic和微軟近幾個月都推出自己的代理功能軟體,以更流暢地執行個人和專業任務。與許多聊天機器人不同,這種新型服務並非用幾行簡潔的文字來回複用戶,而是可委以處理更復雜的任務。
DeepSeek在8月底新推出R1升級版V3.1,相較於R1模型,V3.1能在更短時間內給出答案。此外,通過「後訓練」優化,新模型在工具使用與智慧體任務中的表現有較大提升。
至於R2大模型遲未公佈,外媒稍早報導,DeepSeek R2利用華爲升騰(Ascend)910B晶片負載的訓練失敗,導致R2已二度推遲發表時間,至今未定。