中教圖申請一種基於彈性搜索的文獻語義搜索方法及系統專利,顯著提高文獻檢索的準確性

金融界2025年8月7日消息,國家知識產權局信息顯示,中國教育圖書進出口有限公司申請一項名爲“一種基於彈性搜索的文獻語義搜索方法及系統”的專利,公開號CN120429311A,申請日期爲2025年07月。

專利摘要顯示,本申請公開了一種基於彈性搜索的文獻語義搜索方法及系統,涉及數據檢索:利用基於CoSENT方法訓練的text2vec-base-multilingual模型對名詞短語列表進行向量化處理;根據語義向量,在第二檢索模塊中進行近似最近鄰搜索,得到第一候選數據;將查詢文本數據輸入第一檢索模塊,通過BM25算法進行關鍵詞匹配,得到第二候選數據;將第一候選數據和第二候選數據進行融合,得到第三候選數據;採用Sequence Matcher算法計算第三候選數據中擴展詞之間的字符串相似度,基於最長公共子序列長度設定相似度閾值並進行去重,得到第四候選數據;對第四候選數據進行基於位置和相似度得分的權重分配,通過擴大得分區間增強擴展詞區分度,得到擴展詞推薦列表數據。

天眼查資料顯示,中國教育圖書進出口有限公司,成立於1987年,位於北京市,是一家以從事零售業爲主的企業。企業註冊資本22336萬人民幣。通過天眼查大數據分析,中國教育圖書進出口有限公司共對外投資了5家企業,參與招投標項目5000次,財產線索方面有商標信息49條,專利信息2條,此外企業還擁有行政許可9個。

本文源自金融界