百度商業發佈中文音視頻一體化生成模型MuseSteamer

每經北京7月2日電(記者可楊)《每日經濟新聞》記者從百度方面獲悉,百度商業研發團隊發佈自研視頻生成模型“MuseSteamer”及創作平臺“繪想”。

MuseSteamer支持一張圖生成10秒1080p電影級畫質視頻,人物微表情與運鏡效果達專業影視水準。其核心能力源於億級中文多模態數據清洗、精細化視頻結構化描述語言,以及多目標強化學習等技術優化。

MuseSteamer模型家族包含Turbo、Lite、Pro及全系列有聲版,覆蓋從普通創作者到專業影視機構的需求。其中Turbo版已上線繪想平臺開啓限時免費公測,其餘版本將於8月陸續開放。

(封面圖片來源:每日經濟新聞 資料圖)