蔚時科技申請一種分佈式的強化學習訓練系統等專利,更好的滿足在數據同步、傳輸效率、模型滯後以及算法支持度等方面的訓練需求

金融界2025年6月21日消息,國家知識產權局信息顯示,北京蔚時科技有限公司申請一項名爲“一種分佈式的強化學習訓練系統、方法及電子設備”的專利,公開號CN120181181A,申請日期爲2025年03月。

專利摘要顯示,本申請提出了一種分佈式的強化學習訓練系統、方法及電子設備,涉及人工智能技術領域。該系統包括分佈式環境採樣單元、智能體訓練單元及分佈式對象存儲單元。分佈式環境採樣單元設多個並行採樣器,各含仿真環境與Runner模塊,Runner接收動作信號,在仿真環境中執行並收集信息,存入經驗池。智能體訓練單元含Action與Learner模塊,Action基於最新狀態數據生成動作指令至採樣器,Learner從經驗池獲取數據優化模型。分佈式對象存儲單元作爲經驗池,存儲所有采樣器數據,並與智能體訓練單元交互。三者通過數據同步機制協調,包括數據同步與梯度同步。該系統能夠更好的滿足在數據同步、傳輸效率、模型滯後以及算法支持度等方面的訓練需求。

天眼查資料顯示,北京蔚時科技有限公司,成立於2022年,位於北京市,是一家以從事科技推廣和應用服務業爲主的企業。企業註冊資本500萬人民幣。通過天眼查大數據分析,北京蔚時科技有限公司專利信息1條,此外企業還擁有行政許可1個。

本文源自:金融界

作者:情報員