騰訊混元支持元寶上新多模態理解能力

騰訊混元支持元寶上新多模態理解能力,通過跨模態協同的架構設計,實現深度思考模型對圖片的理解與推理。相比傳統OCR識別僅提取圖像中的文字內容,缺乏語義關聯。混元多模態理解模型能夠融合視覺、文本、佈局等多模態信息,理解圖像中各元素之間的關係,對圖片含義有更深層次的解析,爲語言模型執行推理任務提供更豐富的信息基礎。

本文源自:金融界AI電報