面壁智能開源8B參數的多模態模型MiniCPM-V 4.5

8月26日,面壁智能正式開源8B參數的MiniCPM-V 4.5多模態模型,具備“高刷”視頻理解能力。據介紹,該模型高刷視頻理解同級SOTA且性能超過Qwen2.5-VL 72B;同等視覺token開銷下,MiniCPM-V 4.5可接收6倍視頻幀數量,達到96倍視覺壓縮率,是同類模型的12-24倍。