百度跟進視頻生成模型 基礎版限時免費打破行業壁壘

中經記者 李靜 北京報道

7月2日,百度搜索宣佈進行十年來最大改版,其中最引人注目的部分,是其推出的全球首箇中文音視頻一體化生成模型MuseSteamer,該模型由百度商業研發團隊推出,其主打的賣點是有別於傳統AIGC視頻“先畫面後配音”的割裂流程。

《中國經營報》記者注意到,在ChatGPT問世之後,百度很快推出了文小言(原文心一言),並且推出了多款基礎大模型。而當OpenAI推出視頻生成模型Sora,引發國內外衆多廠商紛紛入局的熱潮時,百度並未跟風快速推出類似產品。直至近日,百度才正式推出首款視頻生成模型 MuseSteamer,此舉標誌着百度正式進軍視頻生成模型賽道。

“實際上百度一直在關注視頻生成模型領域。”百度副總裁、移動生態商業體系負責人陳一凡在接受採訪時透露,“MuseSteamer由百度商業研發團隊推出,其實來自客戶需求的推動,因爲商業體系對生成類廣告創意素材的需求旺盛。”

商業需求倒逼模型發展

與很多技術驅動型的視頻生成模型不同,百度MuseSteamer 的研發啓動並非技術驅動,是被廣告主用需求“催生”出來的。

“去年年初行業就在卷視頻生成模型,我們不是沒看,但真正推動自研的,是商業體系收到的具體需求。”陳一凡回憶道,2024年年底短劇投流市場爆發,傳統剪輯和生圖已無法滿足創意需求,就有代理商和廣告主向百度提出:“能不能用短劇內容做剪輯?”“科幻場景拍不出來,能生成嗎?”

面對這些需求,百度商業團隊曾有兩個選擇:接入外部模型,或自己動手。但當他們嘗試反饋優化建議時,卻發現外部模型迭代週期太長。於是今年春節後,團隊決定自研,項目代號就是“MuseSteamer”。

在百度MuseSteamer的自研過程中,不只是短劇行業,更多的行業客戶向百度反饋“希望能用大模型提高廣告質量”。

陳一凡表示,由百度商業研發團隊推出的MuseSteamer正是來自這些需求的推動。“今天演示的視頻偏動漫類型,其實是大概一個多月前,有客戶想用類似動漫的方式去展現創意廣告,百度大概用了一個多月的時間補足動漫類數據,對模型進行了調整。還有,當發現廣告創意需要更豐富的運鏡時,團隊兩週內就研發出運鏡語言模型,教會AI理解‘鏡頭如何轉場’。”

百度商業體系商業研發總經理劉林透露,MuseSteamer從春節開始立項,到目前爲止,利用三個月左右的有效時間就達到了現在這個效果。一方面百度擎舵平臺本身就有很多多模態生成的模型,有算法層、數據層、模型架構層的積累;另一方面,今年國內深度大模型快速迭代發展,對於多模態大模型發展也有很大的促進作用。

過去一年多,國內視頻生成大模型快速發展。深度科技研究院院長張孝榮指出:“國內視頻生成大模型最明顯的突破是‘可控性’的提升,一些模型能精準控制角色位置、運動軌跡甚至音效同步,用戶不用再碰運氣了。”

值得注意的是,在百度搜索的改版中,MuseSteamer 被嵌入廣告投放後臺,可以形成“需求輸入-創意生成 -效果反饋”的閉環。

“因爲搜索團隊面臨海量長尾需求(如冷門知識、小衆技能教程)時,傳統素材庫常無法覆蓋,而MuseSteamer的視頻生成能力可即時填補這一空白。”百度商業研發首席架構師李雙龍進一步指出。

或掀起行業價格戰

據瞭解,這次百度MuseSteamer還一口氣推出三個版本。其中基礎Turbo版主打主流需求;Lite版面向需要精準動作控制需求的生產;1080P大師級版本則瞄準高端電影運鏡效果。“我們不做特別小衆的需求,而是專注服務最大公約數。”陳一凡解釋。

其中,百度此次推出的 Turbo 版限時免費公測,Lite版面和大師級版本需要一定的付費,這一策略或將直接衝擊視頻創作工具市場。

從面向的人羣受衆來看,陳一凡指出:“C端個人付費用戶在當前階段不是我們的主要目標,更希望先服務好B端客戶,包括小B端的內容製作者以及大B端的廣告主。”

目前,市面上已有的生成視頻大模型產品大多數爲每月提供一定的免費使用積分,但基本只夠用戶嚐鮮使用。如果想要對生成內容進行調試,或者商業化大規模使用,都需要付費使用。

例如,快手自去年推出可靈之後,已經將其作爲大模型時代的重要營收表現。在2025年第一季度的財報上,快手專門披露可靈AI的商業化進程在同步加速,2025年第一季度,可靈AI的營業收入已經達到1.5億元。

從收入構成來看,P(Prosumer,產銷者)端付費訂閱會員貢獻可靈AI將近70%的營業收入。可靈對P端付費訂閱會員包括自媒體視頻創作者和廣告營銷從業者等專業用戶,他們兼具C端用戶的傳播屬性和B端用戶的付費能力,可以說與百度所言的B端客戶羣體有一定重合。

但付費模式一定程度上影響了一些用戶使用生成視頻大模型的意願。有關數據顯示,目前視頻生成大模型和其他頭部的AI產品(如ChatGPT、DeepSeek)在訪問量級上仍然存在較大差距。

來自東方證券研究所的報告顯示,從視頻生成產品的用戶訪問量來看,2025年2月海螺、可靈、Sora位居Top3,分別爲2756萬、1591萬、1050萬;從獨立訪客數看,海螺、Sora、可靈分別以634萬、592萬、376萬保持領先。而同期,DeepSeek國內web端用戶訪問量爲5.7億。

“如果成本不行,基本上大家就不會用,我們希望有越來越多的人用起來它。”陳一凡的表述透露着百度的市場策略:通過免費公測與分層付費模式,打破行業付費壁壘,推動視頻生成技術的普及化應用。

行業其他玩家是否會緊隨百度之後推出免費版本的視頻生成模型,還值得觀察。

(編輯:張靖超 審覈:李正豪 校對:顏京寧)