浙江大學科大訊飛申請僞造語音聲紋解混方法及系統專利,提高語音驗證系統抗僞造能力

金融界2025年7月4日消息,國家知識產權局信息顯示,浙江大學;科大訊飛股份有限公司申請一項名爲“一種僞造語音聲紋解混方法及系統”的專利,公開號CN120260575A,申請日期爲2025年04月。

專利摘要顯示,本發明公開了一種僞造語音聲紋解混方法及系統,涉及語音處理和深度學習技術領域,包括以下步驟:基於Transformer模型對輸入的僞造語音進行特徵提取,得到包含源說話人聲紋信息的粗略特徵;採用殘差正交化方法對粗略特徵進行分解,恢復源說話人的聲紋特徵;對源說話人的聲紋特徵進行維度歸一化,得到固定長度的聲紋特徵;使用加性角度邊距損失增強源說話人與其他聲紋之間的角度差異,輸出解混後音頻數據。本發明能夠有效去除語音轉換後目標說話人聲紋的影響,恢復源說話人的真實聲紋特徵,從而提高語音驗證系統的抗僞造能力。

本文源自:金融界

作者:情報員