阿里萬相視頻生成模型開源,能在消費級顯卡運行

2月25日,阿里雲旗下視覺生成基座模型萬相2.1(Wan)正式開源,此次開源採用最寬鬆的Apache2.0協議,14B和1.3B兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務,全球開發者可在Github、HuggingFace和魔搭社區下載體驗。

據介紹,14B萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方面表現突出。1.3B版本測試結果不僅超過了更大尺寸的開源模型,甚至還接近部分閉源模型,同時能在消費級顯卡運行,僅需8.2GB顯存就可以生成高質量視頻,適用於二次模型開發和學術研究。(澎湃新聞記者 胡含嫣)