思必馳申請面向VQTTS模型語音合成缺陷修正方法等專利,在不更新模型的前提下修正合成缺陷

金融界2025年5月23日消息,國家知識產權局信息顯示,思必馳科技股份有限公司申請一項名爲“面向VQTTS模型的語音合成缺陷修正方法、設備及存儲介質”的專利,公開號CN120032621A,申請日期爲2025年01月。

專利摘要顯示,本申請涉及語音合成技術領域,尤其涉及一種面向VQTTS模型的語音合成缺陷修正方法、設備及存儲介質,包括獲取合成文本,定位合成缺陷位置的文本爲缺陷短語T;使用大語言模型生成M個包含缺陷短語T的文本W;利用VQTTS對文本W進行語音合成,若是判斷合成語音不存在缺陷,截取片段並添加至集合K中;將(T,K)配對添加至系統數據集中;獲取待合成的輸入文本W,生成M個長度爲K的Oracle向量;若缺陷短語T是輸入文本W的子字符串,更新Oracle向量;使用VQTTS和Beam Search算法生成修正後的韻律標籤序列;選擇最佳離散韻律標籤序列並生成語音。

天眼查資料顯示,思必馳科技股份有限公司,成立於2007年,位於蘇州市,是一家以從事軟件和信息技術服務業爲主的企業。企業註冊資本38981.5864萬人民幣。通過天眼查大數據分析,思必馳科技股份有限公司共對外投資了20家企業,參與招投標項目103次,財產線索方面有商標信息243條,專利信息1297條,此外企業還擁有行政許可17個。

本文源自:金融界

作者:情報員