廣州未界智能科技申請基於AI大模型的語音識別方法及其系統專利,實現精準語音識別

金融界2025年7月19日消息,國家知識產權局信息顯示,廣州未界智能科技有限公司申請一項名爲“基於AI大模型的語音識別方法及其系統”的專利,公開號CN120340465A,申請日期爲2025年04月。

專利摘要顯示,本發明提供一種基於AI大模型的語音識別方法及其系統,語音識別技術領域,本發明首先通過預訓練的對抗噪聲抑制網絡實現噪聲環境下的降噪和頻段增強,並結合多維度的頻譜質量評分爲後續處理提供依據,其次,基於元特徵向量與預構建的方言熱力圖庫的相似度匹配以及基於頻譜質量評分的匹配權重調整,實現對特定方言發音偏差的精準建模,再者,通過超網絡生成的聲學適配矩陣和語言模型適配矩陣,提升模型對不同方言的適應能力,此外,將融合熱力圖與聲學適配矩陣共同注入預訓練的聲學模型,通過多層級注意力修正改善方言音素的識別準確率,最後,採用熱力圖引導的集束搜索算法並結合對抗判別網絡的驗證,實現精準語音識別。

天眼查資料顯示,廣州未界智能科技有限公司,成立於2025年,位於廣州市,是一家以從事研究和試驗發展爲主的企業。企業註冊資本300萬人民幣。通過天眼查大數據分析,廣州未界智能科技有限公司專利信息1條。

本文源自:金融界

作者:情報員