☰

騰訊混元發佈並開源語音數字人模型HunyuanVideo-Avatar

5月28日，騰訊混元發佈並開源語音數字人模型HunyuanVideo-Avatar，基於騰訊混元視頻大模型（HunyuanVideo）及騰訊音樂天琴實驗室MuseV技術聯合研發，支持頭肩、半身與全身景別，以及多風格、多物種與雙人場景，面向視頻創作者提供高一致性、高動態性的視頻生成能力。

用戶可上傳人物圖像與音頻，HunyuanVideo-Avatar模型會自動理解圖片與音頻，比如人物所在環境、音頻所蘊含的情感等，讓圖中人物自然地說話或唱歌，生成包含自然表情、脣形同步及全身動作的視頻。

相關資訊

▣ 騰訊混元發佈並開源語音數字人模型
▣ 騰訊混元發佈並開源語音數字人模型，已應用於QQ音樂、全民K歌、酷狗音樂
▣ 騰訊混元圖生視頻模型發佈並開源
▣ 騰訊混元3D世界模型正式發佈並開源
▣ 騰訊混元宣佈大語言模型和3D模型正式開源
▣ 騰訊混元首款開源混合推理MoE模型發佈
▣ 騰訊混元大語言模型和3D模型正式開源
▣ 騰訊混元發佈四款開源小尺寸模型
▣ 騰訊混元3D世界模型發佈即開源，助力遊戲開發、數字內容創作提效
▣ AI早知道｜騰訊正式發佈並開源混元圖生視頻模型；智源發佈多模態向量模型BGE-VL
▣ 騰訊開源混元-A13B模型
▣ 騰訊混元上線並開源新圖生視頻模型
▣ 騰訊宣佈混元3D 2.1大模型對外開源
▣ 騰訊開源混元3D 2.1大模型
▣ 騰訊宣佈混元文生圖大模型對外開源
▣ 騰訊混元兩大核心模型開源
▣ 騰訊混元將有多款模型開源
▣ 騰訊混元發佈多模態理解模型混元Large-Vision
▣ 騰訊發佈自研AI模型混元T1
▣ 騰訊混元0.5B、1.8B、4B、7B模型發佈
▣ 數智早參｜OpenAI官宣推出新的大語言模型GPT-4o；騰訊混元文生圖大模型開源
▣ 騰訊混元開源首款混合推理MoE模型，激活參數僅13B
▣ 騰訊混元推出首款開源混合推理模型
▣ 騰訊元寶上線快思考模型混元Turbo S，併發布電腦版
▣ 騰訊混元圖像2.0模型發佈支持文本、語音、草圖等多種交互方式
▣ 騰訊混元發佈開源圖生視頻模型，上傳圖片即可生成5秒帶音效短視頻
▣ 騰訊混元發佈四款開源的小尺寸模型，消費電子ETF（561600）開盤上漲
▣ 騰訊混元3D生成模型正式發佈2.5版本新模型
▣ 騰訊混元文生圖大模型開源訓練代碼

DMCA | PRIVACY | s@bg3.co