谷歌發佈Gemini 2.5 Flash Image,定價低於OpenAI同類模型

據悉,谷歌DeepMind發佈新一代AI圖像生成與編輯模型Gemini 2.5 Flash Image(代號“Nano Banana”),並已提供預覽,數週後將推出穩定版。該模型在測試中獲得“全球評分最高編輯模型”,在角色一致性、精準編輯等方面表現優異。Gemini 2.5 Flash Image定價爲每百萬輸出token 30美元,每張圖像消耗約1290 token(約合0.039美元),低於OpenAI同類模型的每百萬token 40美元定價。

該模型在圖像質量、編輯控制和應用場景上有大幅改進,支持多圖合成、多輪次修改與風格遷移等複雜操作。谷歌DeepMind還開發了可定製的模板應用,方便用戶體驗模型在角色一致性、基於提示的精準圖像編輯、融入現實世界知識和多圖像融合等方面的能力。

AI圖像模型已成爲科技巨頭的核心競爭領域。OpenAI、Meta和Black Forest Labs等均有相關動作。谷歌希望通過Gemini 2.5 Flash Image縮小與OpenAI的用戶差距。目前,ChatGPT的周活躍用戶已超7億人,而Gemini的月活躍用戶爲4.5億。

谷歌爲Gemini 2.5 Flash Image設置了安全防護機制,禁止生成“未經同意的私密圖像”,併爲AI生成的圖像添加視覺水印及元數據標識,以應對深度僞造圖像問題。