中電網絡空間研究院申請面向互聯網社交媒體的文本分類模型訓練方法及裝置專利,降低人工成本

金融界2025年5月27日消息,國家知識產權局信息顯示,中電網絡空間研究院有限公司申請一項名爲“一種面向互聯網社交媒體的文本分類模型訓練方法及裝置”的專利,公開號CN120045969A,申請日期爲2023年11月。

專利摘要顯示,本發明提供一種面向互聯網社交媒體的文本分類模型訓練方法及裝置,包括:獲取第一訓練數據集,其包含多個樣本,每個樣本包含從不同極性網頁獲得的文本數據;獲取初始模型,初始模型採用ERNIE模型,包含數據預處理模塊和分類模塊;將各樣本按批輸入數據預處理模塊進行數據清洗和預處理操作,將處理後的樣本輸入分類模塊進行分類,得到各樣本的預測結果;採用第一訓練數據集對初始模型進行訓練,構建預測結果和真實分類標籤之間的損失,以最小化損失爲目標,對初始模型進行優化更新,以得到最終的文本分類模型。

本文源自:金融界

作者:情報員