百度申請用於大模型的樣本語料生成等相關專利 涉及多技術領域

金融界2025年6月24日消息,國家知識產權局信息顯示,北京百度網訊科技有限公司申請一項名爲“用於大模型的樣本語料生成方法、訓練方法及測試方法”的專利,公開號CN120196720A,申請日期爲2025年03月。

專利摘要顯示,本公開提供了用於大模型的樣本語料生成方法、訓練方法及測試方法,涉及人工智能技術領域,尤其涉及大語言模型、生成式模型、大數據、知識圖譜等技術領域。該用於大模型的樣本語料生成方法包括:對語料需求信息進行意圖識別,得到語料需求意圖;從多個業務實體中,確定與語料需求意圖中的場景需求屬性相匹配的目標實體,業務實體是從業務基礎數據中提取的,業務實體的場景相關性屬性表徵業務實體與執行指定業務場景的執行條件之間的匹配度,場景需求屬性表徵對於匹配度的需求意圖;利用大語言模型處理目標實體,得到樣本語料。

天眼查資料顯示,北京百度網訊科技有限公司,成立於2001年,位於北京市,是一家以從事互聯網和相關服務爲主的企業。企業註冊資本1342128萬人民幣。通過天眼查大數據分析,北京百度網訊科技有限公司共對外投資了76家企業,參與招投標項目2972次,財產線索方面有商標信息1004條,專利信息5000條,此外企業還擁有行政許可56個。

本文源自:金融界

作者:情報員