百度申請文檔圖像還原及多模態大模型訓練方法和裝置專利,可編輯文件還原文檔內容
金融界2024年10月29日消息,國家知識產權局信息顯示,北京百度網訊科技有限公司申請一項名爲“文檔圖像還原及多模態大模型訓練方法和裝置”的專利,公開號 CN 118823798 A,申請日期爲2024年6月。
專利摘要顯示,本公開提供了文檔圖像還原及多模態大模型訓練方法和裝置,涉及計算機視覺、深度學習以及大模型等人工智能領域。其中的方法可包括:獲取待處理的目標文檔圖像;將目標文檔圖像作爲多模態大模型的輸入,得到輸出的第一文件,第一文件爲符合預定表示格式的超文本標記語言文件;根據第一文件生成作爲還原結果的第二文件,第二文件爲可編輯的文件,且第二文件中包括目標文檔圖像中的文檔內容。
本文源自:金融界
作者:情報員
相關資訊
- ▣ 網易申請模型訓練方法相關專利,提高圖像編輯模型生成的人臉圖像與預期修改文本的匹配度
- ▣ 百度取得一種模型訓練、文本排序方法和裝置專利
- ▣ 百度申請內容推薦及意圖識別模型訓練相關專利,提供一種內容推薦及意圖識別模型訓練方法
- ▣ 百度國際申請基於大模型的多模態內容提取模型的訓練方法及智能體專利,有效提高訓練的多模態內容提取模型的準確性
- ▣ 百度申請圖像生成及智能駕駛模型訓練相關專利,提供圖像生成及智能駕駛模型訓練方法
- ▣ 百度申請圖像識別模型訓練方法等專利,涉及人工智能技術領域
- ▣ 百度申請基於大模型的問答模型訓練及問答方法等專利,修正答案文本偏好度高於初始答案文本
- ▣ 艾德思申請基於大模型文檔處理優化潤色方法和裝置專利 提升對上下文理解能力
- ▣ 北京大學申請中文醫學大語言模型訓練方法及裝置專利,提高大語言模型在醫學領域回答的準確度
- ▣ 百度申請文本檢測及文本檢測模型訓練方法專利,可獲得待檢測文本的目標粒度的目標檢測結果
- ▣ 微衆銀行申請反欺詐模型的生成方法及裝置專利,提高模型的訓練速度
- ▣ 華爲申請圖像文件編解碼方法專利,提高圖像文件壓縮率
- ▣ 百度取得圖像模型的訓練及圖像降噪相關專利
- ▣ 銳明像素申請基於多模態大模型的道路病害檢測方法及裝置專利,能夠提高檢測精度
- ▣ 阿里健康科技申請大語言模型的訓練方法及相關裝置專利,一定程度上提升大語言模型的翻譯文本的準確性
- ▣ 粉筆上岸申請基於大模型的論文生成方法及裝置專利,提升論文生成質量和效率
- ▣ OPPO申請圖像編輯方法專利,提高圖像編輯效率
- ▣ 威海藍海銀行申請基於多模態融合的文檔圖像篡改檢測方法專利,解決圖像篡改檢測的技術問題
- ▣ 華爲申請模型訓練方法和裝置專利,節省設備間訓練數據收集通信開銷
- ▣ 百度申請樣本生成及大語言模型相關方法和裝置專利,涉及人工智能多技術領域
- ▣ 賽力斯申請一種車輛故障診斷模型及其訓練和使用方法、裝置及介質專利,提高模型的診斷精度和準確性
- ▣ 悅數科技申請基於圖數據庫GQL語法的文檔可視化方法及裝置專利,顯著提高了技術文檔的可讀性與維護效率
- ▣ 百度取得文檔的生成方法、裝置、電子設備和介質專利
- ▣ 青島道可雲申請物體模型展示方法及系統專利,能夠更真實地還原模型細節
- ▣ 騰訊科技申請一種模型處理方法專利,提高文生圖模型的圖像生成質量
- ▣ 地鐵設計獲得發明專利授權:“一種Revit建模文件轉換YJK模型文件的方法及裝置”
- ▣ 百度申請圖像處理方法及裝置、設備和介質專利,涉及圖像的顏色配置技術領域
- ▣ 天融信申請模型訓練及惡意文件檢測相關專利,有效提高惡意PDF文件檢測的精確性和可靠性
- ▣ 谷歌申請經由擴散模型的圖像特定微調的文本驅動圖像編輯專利,可在保持對輸入圖像的高語義和視覺保真度的同時執行編輯