騰訊混元發佈開源圖生視頻模型,上傳圖片即可生成5秒帶音效短視頻
3月6日消息,今天下午,騰訊混元發佈圖生視頻模型並對外開源,同時上線對口型與動作驅動等玩法,並支持生成背景音效及2K高質量視頻。
據介紹,基於圖生視頻的能力,用戶只需上傳一張圖片,並簡短描述希望畫面如何運動、鏡頭如何調度等,混元即可按要求讓圖片動起來,變成5秒的短視頻,還能自動配上背景音效。
此外,上傳一張人物圖片,並輸入希望“對口型”的文字或音頻,圖片中的人物即可“說話”或“唱歌”;使用“動作驅動”能力,還能一鍵生成同款跳舞視頻。
目前用戶通過混元AI視頻官網即可體驗,企業和開發者可在騰訊雲申請使用API接口使用。(袁寧)
相關資訊
- ▣ 騰訊混元圖生視頻模型發佈並開源
- ▣ 騰訊混元上線並開源新圖生視頻模型
- ▣ AI早知道|騰訊正式發佈並開源混元圖生視頻模型;智源發佈多模態向量模型BGE-VL
- ▣ 騰訊混元大模型上線視頻生成能力
- ▣ 60秒內可生成5秒AI視頻 豆包視頻生成模型Seaweed上線即夢AI
- ▣ AI早知道|騰訊混元宣佈開源定製化圖像生成插件;通義萬相宣佈開源首尾幀生視頻模型
- ▣ 騰訊混元上線AI生成視頻並全面開源
- ▣ 60秒內生成5秒AI視頻,豆包視頻生成模型Seaweed上線即夢AI
- ▣ 阿里巴巴重磅宣佈! 全面開源視頻生成模型萬相2.1模型 同時支持文生視頻和圖生視頻任務
- ▣ OpenAI發佈首個視頻生成模型,可生成60秒一鏡到底視頻
- ▣ RunningHub率先支持騰訊混元圖生視頻模型!一鍵創作高質量視頻,無需本地部署!
- ▣ 騰訊宣佈混元文生圖大模型對外開源
- YouTube集成谷歌視頻生成模型Veo,可創作六秒鐘短視頻
- Runway 發佈第三代視頻生成模型,90 秒生成 10 秒片段
- ▣ 發佈即開源:智譜AI最新視頻模型支持10秒60幀4K畫質,還自帶音效
- ▣ 快手公佈圖生視頻模型專利
- ▣ 智譜AI發佈AI生成視頻模型清影(Ying):生成6秒視頻只需30秒
- ▣ 騰訊混元上線AI生成視頻並全面開源,文生視頻領域仍處於技術打磨階段
- ▣ 階躍星辰將在3月開源圖生視頻模型
- ▣ 崑崙萬維開源AI短劇視頻生成模型
- ▣ 騰訊、清華、港科大推出圖生視頻大模型“Follow Your Click”
- ▣ Kimi內部灰測視頻生成功能,騰訊混元視頻生成12月上線 | 藍媒GPT
- ▣ 快手可靈大模型推出圖生視頻及視頻續寫功能
- ▣ 騰訊混元文生圖大模型開源訓練代碼
- ▣ 阿里宣佈開源推理模型和視頻生成模型
- ▣ 智譜開源視頻生成模型CogVideoX
- ▣ 騰訊混元文生圖模型開源 採用Sora同架構
- ▣ 豆包視頻生成大模型發佈
- ▣ 谷歌發佈視頻生成模型VideoPoet