谷歌申請使用生成式模型生成基於音頻和/或基於視聽的音樂內容專利,利用生成式模型生成音樂內容

金融界2025年7月18日消息,國家知識產權局信息顯示,谷歌有限責任公司申請一項名爲“使用生成式模型生成基於音頻和/或基於視聽的音樂內容”的專利,公開號CN120340446A,申請日期爲2025年04月。

專利摘要顯示,本公開涉及使用生成式模型生成基於音頻和/或基於視聽的音樂內容。實現方式涉及利用生成式模型(GM)生成包括至少歌詞內容和音樂創作內容的音樂內容。系統的處理器可以:接收與用戶的客戶端裝置相關聯的用戶輸入,該用戶輸入包括對音樂內容的請求;生成音樂內容;以及致使該音樂內容在客戶端裝置處被可聽地渲染。在一些實現方式中,處理器可以致使單個GM處理GM輸入(包括至少用戶輸入)以生成GM輸出,並且可以基於GM輸出來確定歌詞內容和音樂創作內容。在其他實現方式中,處理器可以致使多個GM處理相應的GM輸入(每個GM輸入包括至少用戶輸入)以生成相應的GM輸出,並且可以基於相應的GM輸出來確定歌詞內容和音樂創作內容。

本文源自:金融界

作者:情報員