阿里開源視頻生成模型Wan2.2-S2V

財聯社8月26日電,阿里開源多模態視頻生成模型通義萬相Wan2.2-S2V,僅需一張靜態圖片和一段音頻,即可生成面部表情自然、口型一致的電影級數字人視頻。該模型單次生成的視頻時長可達分鐘級。