重慶郵電大學等申請基於遷移強化學習的機器人避障方法和裝置專利,減少訓練過程中的成本損耗
金融界2025年7月26日消息,國家知識產權局信息顯示,重慶郵電大學、北京海雲捷迅科技股份有限公司申請一項名爲“基於遷移強化學習的機器人避障方法和裝置”的專利,公開號CN120370932A,申請日期爲2025年04月。
專利摘要顯示,本申請實施例提供一種基於遷移強化學習的機器人避障方法和裝置。應用於機器人避障控制技術領域,該方法通過獲取目標域數據集,對數據集進行預處理後輸入至訓練好的Transformer模型,通過Transformer模型輸出新的數據樣本;將原始數據樣本和新的數據樣本進行混合,得到目標域合成數據集;採用條件變分自編碼器根據目標域合成數據集進行目標域數據分佈建模,確定目標域上數據的狀態轉移概率;利用雙二元分類器架構根據機器人狀態動作的實時交互數據確定源域上數據的狀態轉移概率;基於目標域的狀態轉移概率和源域的狀態轉移概率,對源域上訓練的機器人避障策略進行遷移,減少了訓練過程中的成本損耗,增加了避障策略的環境適應性。
本文源自:金融界
作者:情報員