支付寶申請一種語音識別方法、裝置及設備專利,通過語音大模型對語音數據進行語音識別處理
金融界2025年7月9日消息,國家知識產權局信息顯示,支付寶(杭州)信息技術有限公司申請一項名爲“一種語音識別方法、裝置及設備”的專利,公開號CN120279898A,申請日期爲2025年04月。
專利摘要顯示,本說明書實施例公開了一種語音識別方法、裝置及設備,該方法包括:接收用戶輸入的語音數據和用戶輸入的記錄有語音數據中包含的目標熱詞的熱詞文本數據;提取語音數據中的語音特徵,得到語音數據對應的第一語音特徵,並對第一語音特徵進行編碼處理,得到第一語音特徵對應的語音編碼數據,對熱詞文本數據中的每個目標熱詞進行編碼處理,得到每個目標熱詞對應的熱詞編碼數據;將第一語音特徵對應的語音編碼數據與每個目標熱詞對應的熱詞編碼數據進行融合處理,得到第一融合數據,並基於第一融合數據,確定語音數據對應的語音表徵;基於語音表徵,通過語音大模型對語音數據進行語音識別處理,得到語音數據的語音識別結果。
天眼查資料顯示,支付寶(杭州)信息技術有限公司,成立於2016年,位於杭州市,是一家以從事互聯網和相關服務爲主的企業。企業註冊資本10000萬人民幣。通過天眼查大數據分析,支付寶(杭州)信息技術有限公司共對外投資了12家企業,參與招投標項目47次,財產線索方面有商標信息1條,專利信息5000條,此外企業還擁有行政許可58個。
本文源自金融界