☰

百度商業發佈中文音視頻一體化生成模型MuseSteamer

每經北京7月2日電（記者可楊）《每日經濟新聞》記者從百度方面獲悉，百度商業研發團隊發佈自研視頻生成模型“MuseSteamer”及創作平臺“繪想”。

MuseSteamer支持一張圖生成10秒1080p電影級畫質視頻，人物微表情與運鏡效果達專業影視水準。其核心能力源於億級中文多模態數據清洗、精細化視頻結構化描述語言，以及多目標強化學習等技術優化。

MuseSteamer模型家族包含Turbo、Lite、Pro及全系列有聲版，覆蓋從普通創作者到專業影視機構的需求。其中Turbo版已上線繪想平臺開啓限時免費公測，其餘版本將於8月陸續開放。

（封面圖片來源：每日經濟新聞資料圖）

相關資訊

▣ 百度發佈自研模型MuseSteamer：一張圖可生成電影級高清有聲視頻
▣ 百度上線蒸汽機2.0視頻生成大模型，實現多人有聲視頻一體化
▣ 文生視頻大模型集體上線商業化競爭加劇
▣ OpenAI發佈文生視頻模型“Sora”
▣ OpenAI發佈首個視頻生成模型，可生成60秒一鏡到底視頻
▣ 豆包視頻生成大模型發佈
▣ 谷歌發佈視頻生成模型VideoPoet
▣ 通義萬相發佈視頻生成模型
▣ 智譜AI發佈生成式視頻模型
▣ MiniMax低調發布首款文生視頻模型
▣ 英偉達發佈了一款模型，可以生成音樂和音頻
▣ 中信建投：海內外視頻模型密集發佈 API打開商業化空間
▣ 字節跳動進軍AI視頻生成，發佈兩款視頻生成大模型
▣ 阿里通義將發佈視頻生成大模型
▣ 智譜AI發佈AI生成視頻模型清影
▣ Runway發佈新一代視頻生成模型，行業還有哪些難題待解？
▣ 生數科技發佈多模態高可控視頻生成模型
▣ 百度網盤進化成學習神器：音視頻轉文稿、加字幕，一鍵生成PPT！
▣ “視頻生成大模型”角逐資本市場，誰先跑通商業化？
▣ 釘釘上新老舊系統一鍵AI化，MiniMax發佈文生視頻模型 | 藍媒GPT
▣ 豆包視頻生成模型Seedance 1.0 pro正式發佈實時語音模型同步全量上線
▣ 谷歌發佈新AI視頻生成模型Veo3 支持同時生成畫面和背景音
▣ 騰訊混元發佈開源圖生視頻模型，上傳圖片即可生成5秒帶音效短視頻
▣ 字節跳動正式進軍AI視頻生成賽道一天發佈兩款視頻生成大模型
▣ 豆包視頻生成模型Seedance 1.0 pro正式發佈
▣ OpenAI文生視頻模型Sora在歐盟和英國發布
▣ 字節跳動豆包大模型下週將發佈視頻生成模型
▣ 智譜AI發佈AI生成視頻模型清影（Ying）：生成6秒視頻只需30秒
▣ 阿里巴巴重磅宣佈！全面開源視頻生成模型萬相2.1模型同時支持文生視頻和圖生視頻任務

DMCA | PRIVACY | s@bg3.co