海信視像申請顯示設備等相關專利,提高合成語音的擬人度

金融界2024年12月12日消息,國家知識產權局信息顯示,海信視像科技股份有限公司申請一項名爲“顯示設備、服務器及語音合成方法”的專利,公開號 CN 119107933 A,申請日期爲 2024 年 7 月。

專利摘要顯示,本申請提供一種顯示設備、服務器及語音合成方法。所述顯示設備在接收到用戶輸入的語音交互指令時,調用語言提取模型提取樣本文本中的逐字向量和整句向量。語言提取模型爲根據樣本文本訓練得到的模型,且樣本文本中設置有特徵標籤。通過特徵標籤可以在訓練模型的過程中使模型具有識別口語化特徵的能力,進而在合成語音中增加口語化特徵,提高合成語音的擬人度。根據樣本文本和樣本文本的音頻還可以提取語速標籤向量和音素向量。將逐字向量、整句向量、語速標籤向量和音素向量共同輸入至解碼器可以得到目標合成語音,並由音頻輸出裝置播放目標合成語音。

本文源自:金融界

作者:情報員