騰訊申請智能體動作決策模型相關專利,提升動作決策模型準確性
金融界2025年7月11日消息,國家知識產權局信息顯示,騰訊科技(深圳)有限公司申請一項名爲“智能體的動作決策模型的訓練方法、動作決策方法及裝置”的專利,公開號CN120297323A,申請日期爲2024年01月。
專利摘要顯示,本申請公開了一種智能體的動作決策模型的訓練方法、動作決策方法及裝置,屬於計算機技術領域。本申請通過在歷史軌跡的基礎上構建狀態拓撲圖,能夠充分反映智能體的動作的經驗分佈,對歷史軌跡的信息利用率更高,帶來了更多的信息量,在狀態拓撲圖的基礎上指導訓練動作反饋模型,提升了動作反饋模型的準確性,結合狀態拓撲圖和動作反饋模型,約束動作值模型的訓練過程,得到準確性更好、性能更優的動作值模型,利用動作值模型協助訓練出準確性更好的動作決策模型,有助於對智能體在給定狀態下執行何種動作進行精準決策,並且動作決策模型也可以與大模型結合相互促進訓練,提升雙方各自的性能表現。
天眼查資料顯示,騰訊科技(深圳)有限公司,成立於2000年,位於深圳市,是一家以從事軟件和信息技術服務業爲主的企業。企業註冊資本200萬美元。通過天眼查大數據分析,騰訊科技(深圳)有限公司共對外投資了15家企業,參與招投標項目260次,財產線索方面有商標信息5000條,專利信息5000條,此外企業還擁有行政許可472個。
本文源自:金融界
作者:情報員