浙江大學和科大訊飛申請僞造語音原話者溯源模型構建方法專利,提供高精度的聲紋逆向恢復技術方案
金融界2025年7月4日消息,國家知識產權局信息顯示,浙江大學、科大訊飛股份有限公司申請一項名爲“一種僞造語音原話者溯源模型構建方法”的專利,公開號CN120260579A,申請日期爲2025年04月。
專利摘要顯示,本發明公開了一種僞造語音原話者溯源模型構建方法,應用於人工智能與計算機安全技術領域。包括以下步驟:使用聲紋編碼器,將僞造音頻樣本轉換爲粗顆粒度的聲紋特徵樣本;構建Transformer‑CLAP分層提純模塊,採用特徵聚焦、層級融合、對比學習,得到提純後的目標話者聲紋特徵;構建3級RCB殘差校正模塊,結合原話者身份分類器,逆向推導並恢復原話者身份標識;採用三階段訓練策略,訓練得到僞造語音原話者溯源模型。本發明旨在提供一種高精度的聲紋逆向恢復技術方案,以便於溯源僞造語音原話者的身份信息,對語音僞造技術的濫用行爲形成震懾。
本文源自:金融界
作者:情報員