輝達申請從音頻信號生成文本的語音處理技術專利 從音頻信號生成文本

金融界2025年8月5日消息,國家知識產權局信息顯示,輝達公司申請一項名爲“語音處理技術”的專利,公開號CN120431930A,申請日期爲2025年01月。

專利摘要顯示,本公開的實施例涉及語音處理技術。用於從音頻信號生成文本的裝置、系統和技術。在至少一個實施例中,使用一個或更多個神經網絡從音頻信號生成文本,其中一個或更多個神經網絡包括一個或更多個部分,每個部分用於識別音頻信號的相應時間段的一個或更多個特徵,一個或更多個特徵被用於生成與音頻信號的一個或更多個其他時間段相對應的文本。

本文源自:金融界

作者:情報員