杭州聯匯科技申請基於專業領域生成多模態大模型預訓練交錯數據專利,構建足夠數量且多樣化的交錯數據以提升多模態大模型理解能力

金融界2025年1月15日消息,國家知識產權局信息顯示,杭州聯匯科技股份有限公司申請一項名爲“一種基於專業領域知識生成多模態大模型預訓練交錯數據的方法”的專利,公開號CN 119294485 A,申請日期爲2024年9月。

專利摘要顯示,本發明公開了一種基於專業領域知識生成多模態大模型預訓練交錯數據的方法,包括以下步驟:S1、對原始的專業領域知識數據進行清洗;S2、對清洗後的專業領域知識數據進行去重操作;S3、對去重後的專業領域知識數據按逗號進行切分;S4、提取一條切分後的數據的特徵,並利用得到的特徵在圖像庫中進行搜索,查找與該特徵最接近的圖像特徵;S5、判定數據的特徵與最接近的圖像特徵的相似度是否大於圖文相似性閾值,是的話將該圖像放置在該數據之前,否則跳過;S6、重複步驟S4和S5,直至所有切分後的數據被處理完,生成最終的專業領域交錯數據。本方案可以構建足夠數量且多樣化的交錯數據,以供提升多模態大模型的理解能力。

天眼查資料顯示,杭州聯匯科技股份有限公司,成立於2003年,位於杭州市,是一家以從事軟件和信息技術服務業爲主的企業。企業註冊資本12713.4897萬人民幣,實繳資本9846.4019萬人民幣。通過天眼查大數據分析,杭州聯匯科技股份有限公司共對外投資了8家企業,參與招投標項目672次,知識產權方面有商標信息52條,專利信息106條,此外企業還擁有行政許可14個。

本文源自:金融界

作者:情報員