超越Google 騰訊混元圖像3.0盲測全球第一

國際大模型競技場LMArena最新顯示,騰訊旗下混元圖像3.0(hunyuanimage 3.0)在全球26款模型位居第一。(圖/取自央廣網)

國際大模型競技場LMArena最新顯示,騰訊旗下混元圖像3.0(hunyuanimage 3.0)在全球26款模型位居第一,被評爲最佳綜合文生圖模型,超過Google推出的「Nano-banana」(奈米香蕉)等頂尖閉源模型。值得注意的是,該結果來自全球所有用戶的「盲測」。

LMArena爲美國加州大學伯克利分校推出的創新AI模型評估平臺,評測核心方法是基於人類真實偏好的「盲測」機制,讓用戶對不同AI模型的回答進行匿名投票,衡量模型的表現。

騰訊於9月28日發佈混元圖像3.0,聲稱是全球首個工業級原生多模態生圖模型。更是目前效果最強、參數量最大的開源生圖模型,且效果能夠對標業界頭部閉源模型。

據瞭解,該模型不僅能生成複雜文本、複雜漫畫、表情包,還能生成生動有趣的科普插畫。這些能力能大幅提高插畫師、設計師等視覺創作者的效率,原來需要畫幾個小時的漫畫,現在可能只需要幾分鐘就能實現。舉例而言,用戶只需要輸入提示詞:「生成一個月全食的四格科普漫畫」,模型就可以自主生成完整的月全食科普,無需使用者逐格描述內容。

混元團隊透露,混元圖像3.0目前版本已開放文生圖能力,圖生圖、圖像編輯、多輪交互等版本將於後陸續發佈。

Nano-banana即Gemini 2.5 Flash Image,原本在LMArena廣受好評,其除了文字生成圖片的基本功能,最大的亮點在於圖像進階操作。只要提供一張圖片,就能用簡單指令進行替換、修改或重新構圖,且能維持角色與風格的一致性。