百度申請數據處理方法、訓練方法及內容識別方法及裝置專利,涉及人工智能技術領域

金融界2025年8月22日消息,國家知識產權局信息顯示,北京百度網訊科技有限公司申請一項名爲“數據處理方法、訓練方法及內容識別方法及裝置”的專利,公開號CN120524230A,申請日期爲2025年05月。

專利摘要顯示,本公開提供了數據處理方法、訓練方法及內容識別方法及裝置,涉及人工智能技術領域,尤其涉及深度學習、大模型以及內容識別等技術領域。該數據處理方法的具體實現方案爲:利用大模型對初始文本序列進行修正和語義切分,生成目標文本序列;基於初始文本序列與目標文本序列之間的第一相似度和初始時間戳,確定各目標文本的目標時間戳;根據各目標文本的目標時間戳,從待處理視頻和目標文本序列中確定多個圖文對;以及將多個圖文對進行圖文交替排列,生成用於訓練多模態大模型的樣本數據。

天眼查資料顯示,北京百度網訊科技有限公司,成立於2001年,位於北京市,是一家以從事互聯網和相關服務爲主的企業。企業註冊資本1342128萬人民幣。通過天眼查大數據分析,北京百度網訊科技有限公司共對外投資了77家企業,參與招投標項目3082次,財產線索方面有商標信息1004條,專利信息5000條,此外企業還擁有行政許可57個。

本文源自:金融界

作者:情報員