智譜發佈新一代開源視覺模型GLM-4.5V

每經AI快訊,8月11日,智譜官微宣佈推出開源視覺推理模型GLM-4.5V(總參數106B,激活參數12B),並同步在魔搭社區與Hugging Face開源。據介紹,GLM-4.5V基於智譜新一代旗艦文本基座模型GLM-4.5-Air,延續GLM-4.1V-Thinking技術路線,在41個公開視覺多模態榜單中綜合效果達到同級別開源模型SOTA性能,涵蓋圖像、視頻、文檔理解以及GUI Agent等常見任務。