騰訊申請數據處理方法相關專利,很好地適配中文場景的處理需求

金融界2025年5月23日消息,國家知識產權局信息顯示,騰訊科技(深圳)有限公司申請一項名爲“數據處理方法、裝置、電子設備及存儲介質”的專利,公開號CN120031033A,申請日期爲2023年11月。

專利摘要顯示,本申請涉及機器學習技術領域,尤其涉及一種數據處理方法、裝置、電子設備及存儲介質,所述方法包括:在待處理數據包括中文語料信息的情況下,對所述中文語料信息進行分詞處理,得到多箇中文分詞;確定多個分詞單元分別對應的出現頻次;將所述多個分詞單元中出現頻次滿足第一預設頻次條件的分詞單元確定爲目標分詞單元;基於所述目標分詞單元中的中文分詞進行組合,得到目標子詞;基於所述多箇中文分詞、所述目標子詞生成與所述中文語料信息對應的目標中文詞表。

天眼查資料顯示,騰訊科技(深圳)有限公司,成立於2000年,位於深圳市,是一家以從事軟件和信息技術服務業爲主的企業。企業註冊資本200萬美元。通過天眼查大數據分析,騰訊科技(深圳)有限公司共對外投資了15家企業,參與招投標項目253次,財產線索方面有商標信息5000條,專利信息5000條,此外企業還擁有行政許可439個。

本文源自金融界