百度國際申請基於大模型的多模態內容提取模型的訓練方法及智能體專利,有效提高訓練的多模態內容提取模型的準確性
金融界2025年1月15日消息,國家知識產權局信息顯示,百度國際科技(深圳)有限公司申請一項名爲“基於大模型的多模態內容提取模型的訓練方法及智能體”的專利,公開號CN 119294504 A,申請日期爲2024年9月。
專利摘要顯示,本公開提供了一種基於大模型的多模態內容提取模型的訓練方法及智能體,涉及信息處理、人工智能等技術領域。具體實現方案爲:採集多個多模態文檔中各多模態文檔的各頁內容的頁面,生成頁面庫;對於頁面庫中各頁面,採用預先訓練的多模態大模型,提取頁面的文本內容;基於各頁面的文本內容,構建適用於監督微調任務訓練的第一訓練數據和適用於直接偏好優化任務訓練的第二訓練數據;分別基於第一訓練數據和第二訓練數據,對多模態內容提取模型進行監督微調任務的訓練和直接偏好優化任務的訓練;多模態內容提取模型比多模態大模型的參數少。本公開的技術,能夠有效地提高訓練的多模態內容提取模型的準確性。
天眼查資料顯示,百度國際科技(深圳)有限公司,成立於2010年,位於深圳市,是一家以從事軟件和信息技術服務業爲主的企業。企業註冊資本2000萬美元。通過天眼查大數據分析,百度國際科技(深圳)有限公司參與招投標項目11次,知識產權方面有商標信息17條,專利信息209條,此外企業還擁有行政許可52個。
本文源自:金融界
作者:情報員