追趕全球競爭對手!阿里巴巴升級影片AI「一圖生成影片」
上傳一張人物彈鋼琴的照片、一段歌曲和一段文字,Wan2.2-S2V 即可生成一段完整、聲情並茂的鋼琴演奏影片。圖/取自IT之家
大陸科技巨頭阿里巴巴,更新了開源影片生成模型通義萬相「Wan2.2-S2V」,僅需一張靜態圖片和一段音訊,就可生成面部表情自然、口型一致的電影級數位人影片。延續人工智慧(AI)快速升級節奏,以跟上全球競爭對手。
彭博報導,據通義萬相的微信公衆號,這款模型單次生成的影片時長可達分鐘級,大幅提升數位人直播、影視製作、AI教育等行業的影片創作效率。目前,模型已在通義萬相官網上線。
IT之家報導,Wan2.2-S2V 還支持文本控制,輸入Prompt後,還可對影片畫面進行控制,讓影片主體的運動和背景的變化更豐富。
例如,上傳一張人物彈鋼琴的照片、一段歌曲和一段文字,Wan2.2-S2V 即可生成一段完整、聲情並茂的鋼琴演奏影片,不僅能保證人物形象和原圖一致,面部表情和嘴部動作還能與音訊對齊,影片人物的手指手型、力度、速度也能完美匹配音訊節奏。
阿里巴巴表示,自今年2月以來,通義萬相已連續開源文生影片、圖生影片、首尾幀生影片、全能編輯、音訊生影片等多款模型,在開源社區和三方平臺的下載量已超過2,000萬。
自大陸初創企業深度求索(DeepSeek)今年登上全球舞臺以來,阿里巴巴全面押注AI,但正面臨激烈競爭。美國科技巨頭Alphabet旗下的谷歌、AI初創公司Manus以及快手科技,都在過去幾個月推出了新影片工具或升級版本。
與許多全球科技公司一樣,阿里巴巴在AI上的轉向尚未帶來顯著回報。受大陸消費低迷拖累,阿里巴巴在5月公佈的季度營收僅增長7%。