騰訊混元發佈開源圖生視頻模型,上傳圖片即可生成5秒帶音效短視頻

3月6日消息,今天下午,騰訊混元發佈圖生視頻模型並對外開源,同時上線對口型與動作驅動等玩法,並支持生成背景音效及2K高質量視頻。

據介紹,基於圖生視頻的能力,用戶只需上傳一張圖片,並簡短描述希望畫面如何運動、鏡頭如何調度等,混元即可按要求讓圖片動起來,變成5秒的短視頻,還能自動配上背景音效。

此外,上傳一張人物圖片,並輸入希望“對口型”的文字或音頻,圖片中的人物即可“說話”或“唱歌”;使用“動作驅動”能力,還能一鍵生成同款跳舞視頻。

目前用戶通過混元AI視頻官網即可體驗,企業和開發者可在騰訊雲申請使用API接口使用。(袁寧)