智源研究院宣佈開源超長視頻理解模型Video-XL-2

6月3日,智源研究院宣佈,已聯合上海交通大學等機構發佈新一代超長視頻理解模型:Video-XL-2。據介紹,新模型顯著擴展了可處理視頻的時長,支持在單張顯卡上高效處理長達萬幀的視頻輸入。目前,Video-XL-2的模型權重已全面向社區開放。