AI生成圖片文字不再是亂碼!Google推Nano Banana Pro文字呈現大進化
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其爲目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(圖/翻攝自Google DeepMind頻道)
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,這是今年推出的Nano Banana升級版本,標榜以最新、最強大的Gemini 3 Pro模型作爲核心。Google表示,Nano Banana Pro是目前旗下最擅長生成文字內容的圖像模型,不論是標語、完整段落,甚至多語言文字,都能呈現清晰、正確且可閱讀的字體。
許多AI生成圖片時,在文字方面往往會製作成亂碼,或者根本不存在的文字,不過根據外媒「MacRumors」報導,Google最新推出的Nano Banana Pro在產生海報、模型示意圖等內容時,能支援更多種字體、材質與文字風格。Google強調,新模型也更適合製作需要大量資訊的素材,例如資訊圖表或教學示意圖。使用者可讓模型連結Google搜尋,取得即時資料並融入生成的圖像中,呈現比以往更豐富的內容。
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其爲目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(Google提供)
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其爲目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(Google提供)
Google也表示,Nano Banana Pro提升了圖像的一致性處理能力,使用者最多可上傳 14 張圖片,並能讓模型維持多達五個人物外貌的一致性,這對需要製作多張風格統一的素材相當有用;而在圖像編輯方面,Nano Banana Pro提供更精細的局部編輯功能,讓使用者能針對特定區域進行調整,包括變更視角、焦距、色彩與光線效果等,並支援最高4K的圖像輸出品質。
隨着Nano Banana Pro上線,Google也爲Gemini加入辨識AI生成影像的能力。所有Google AI生成的圖片都會嵌入SynthID辨識資訊,且免費與AI Pro方案用戶生成的圖片會顯示可見浮水印,以便識別到底是否爲AI生成。
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其爲目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(Google提供)
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其爲目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(Google提供)