杜比申請用神經網絡模型進行立體聲解碼方法及解碼器專利,重建立體聲音頻信號

金融界2025年8月1日消息,國家知識產權局信息顯示,杜比國際公司申請一項名爲“神經網絡模型進行立體聲解碼的方法及解碼器”的專利,公開號CN120418863A,申請日期爲2023年12月。

專利摘要顯示,本公開涉及一種用於重建立體聲音頻信號的方法和解碼器。該方法包括:接收(S1)包括已編碼的第一單聲道音頻信號和一組重建參數的比特流;以及對該已編碼的第一單聲道音頻信號進行解碼,以提供第一單聲道音頻信號。該方法進一步包括:使用神經網絡系統(24,24a,24b,24c,24d,24e)重建(S3a)第二單聲道音頻信號,該神經網絡系統被訓練爲在給定第一單聲道音頻信號的樣本和該重建參數的情況下預測第二單聲道音頻信號,或者使用神經網絡系統(24c,24d,24e)重建(S3a,S3b)第二單聲道音頻信號和第三單聲道音頻信號,該神經網絡系統被訓練爲在給定第一單聲道音頻信號的樣本和該重建參數的情況下預測第二單聲道音頻信號和第三單聲道音頻信號。

本文源自:金融界

作者:情報員