☰

騰訊混元發佈開源圖生視頻模型，上傳圖片即可生成5秒帶音效短視頻

3月6日消息，今天下午，騰訊混元發佈圖生視頻模型並對外開源，同時上線對口型與動作驅動等玩法，並支持生成背景音效及2K高質量視頻。

據介紹，基於圖生視頻的能力，用戶只需上傳一張圖片，並簡短描述希望畫面如何運動、鏡頭如何調度等，混元即可按要求讓圖片動起來，變成5秒的短視頻，還能自動配上背景音效。

此外，上傳一張人物圖片，並輸入希望“對口型”的文字或音頻，圖片中的人物即可“說話”或“唱歌”；使用“動作驅動”能力，還能一鍵生成同款跳舞視頻。

目前用戶通過混元AI視頻官網即可體驗，企業和開發者可在騰訊雲申請使用API接口使用。（袁寧）

相關資訊

▣ 騰訊混元圖生視頻模型發佈並開源
▣ 騰訊混元上線並開源新圖生視頻模型
▣ AI早知道｜騰訊正式發佈並開源混元圖生視頻模型；智源發佈多模態向量模型BGE-VL
▣ 騰訊混元大模型上線視頻生成能力
▣ 60秒內可生成5秒AI視頻豆包視頻生成模型Seaweed上線即夢AI
▣ AI早知道｜騰訊混元宣佈開源定製化圖像生成插件；通義萬相宣佈開源首尾幀生視頻模型
▣ 騰訊混元上線AI生成視頻並全面開源
▣ 60秒內生成5秒AI視頻，豆包視頻生成模型Seaweed上線即夢AI
▣ 阿里巴巴重磅宣佈！全面開源視頻生成模型萬相2.1模型同時支持文生視頻和圖生視頻任務
▣ OpenAI發佈首個視頻生成模型，可生成60秒一鏡到底視頻
▣ RunningHub率先支持騰訊混元圖生視頻模型！一鍵創作高質量視頻，無需本地部署！
▣ 騰訊宣佈混元文生圖大模型對外開源
YouTube集成谷歌視頻生成模型Veo，可創作六秒鐘短視頻
Runway 發佈第三代視頻生成模型，90 秒生成 10 秒片段
▣ 發佈即開源：智譜AI最新視頻模型支持10秒60幀4K畫質，還自帶音效
▣ 快手公佈圖生視頻模型專利
首個毫秒級迴應的即時生圖大模型騰訊混元圖像2.0正式發佈
▣ 智譜AI發佈AI生成視頻模型清影（Ying）：生成6秒視頻只需30秒
▣ 騰訊混元上線AI生成視頻並全面開源，文生視頻領域仍處於技術打磨階段
▣ 階躍星辰將在3月開源圖生視頻模型
▣ 崑崙萬維開源AI短劇視頻生成模型
▣ 騰訊、清華、港科大推出圖生視頻大模型“Follow Your Click”
▣ Kimi內部灰測視頻生成功能，騰訊混元視頻生成12月上線 | 藍媒GPT
▣ 快手可靈大模型推出圖生視頻及視頻續寫功能
▣ 可靈AI宣佈多圖參考生視頻升級：模型效果提升102%
▣ 騰訊混元文生圖大模型開源訓練代碼
▣ 阿里宣佈開源推理模型和視頻生成模型
▣ 智譜開源視頻生成模型CogVideoX
▣ 騰訊混元文生圖模型開源採用Sora同架構

DMCA | PRIVACY | s@bg3.co