面壁智能申請中文語料清洗方法等專利 便於提高訓練後模型輸出結果準確率

金融界2025年8月9日消息,國家知識產權局信息顯示,北京面壁智能科技有限責任公司申請一項名爲“一種中文語料清洗方法、裝置、電子設備及可讀存儲介質”的專利,公開號CN120448369A,申請日期爲2024年02月。

專利摘要顯示,本申請的實施例公開了一種中文語料清洗方法、裝置、電子設備及可讀存儲介質,涉及自然語言處理技術領域,爲便於提高訓練後的模型的輸出結果的準確率而發明。所述方法,包括:確定待清洗的中文語料中各相鄰段落的語義是否連貫;根據相鄰段落的語義是否連貫,將各個段落劃分爲至少一個語料樣本,以使所述至少一個語料樣本中的每個語料樣本內的各段落語義連貫,且不同語料樣本的段落彼此之間語義不連貫;根據預設的清洗規則,對所述至少一個語料樣本,進行清洗。

天眼查資料顯示,北京面壁智能科技有限責任公司,成立於2022年,位於北京市,是一家以從事軟件和信息技術服務業爲主的企業。企業註冊資本64.01345萬人民幣。通過天眼查大數據分析,北京面壁智能科技有限責任公司共對外投資了8家企業,參與招投標項目7次,財產線索方面有商標信息95條,專利信息34條,此外企業還擁有行政許可2個。

本文源自:金融界

作者:情報員