Google推出「Nano Banana Pro」影像生成平臺 整合Gemini 3模型、強化文字渲染與14張圖合成能力

Google 稍早揭曉代號爲「Nano Banana Pro」、同時也被稱爲 Gemini 3 Pro Image 的全新影像生成平臺。官方強調此版本基於近期推出的 Gemini 3 模型架構 ,在各方面均較前代軟體有所提升,號稱能將使用者的願景轉化爲具備「前所未有的控制力、完美的文字渲染與增強的世界知識」的「工作室等級設計」。

強化文字渲染,支援多語系海報製作

此次升級的一大重點在於文字渲染 (text rendering) 能力。Nano Banana Pro 被賦予了製作內容豐富的資訊圖表 (infographics) 與圖解 (diagrams) 的能力 。

軟體現在能夠在既有圖像上渲染出清晰可讀的文字,使其成爲生成海報等素材的理想工具 。Google 也表示,此功能目前已支援多種語言,其中也包含臺灣使用的繁體中文,甚至能正確呈現中文字結構。

支援 14 張圖合成,可調視角與光影

在編輯與合成方面,Google 表示新平臺能將多個元素融合爲單一作品,並且具備一次使用多達 14 張圖像進行合成的能力 。

此外,Nano Banana Pro 也導入了豐富的編輯控制選項。使用者可以選取並編輯生成圖像中的任何部分,功能涵蓋調整相機角度、改變對焦點、調整色彩分級 (color grade),甚至能直接將場景的光線從白天轉換爲夜晚 。

在相關測試中,Nano Banana Pro 不僅能正確依照文字描述生成圖像,甚至也不會出現過往「酒杯難以裝滿酒」、「時鐘指針難以指向正確時間」等問題。

導入 C2PA 標示,免費版每日限額

爲了應對生成式 AI 內容識別與 Deepfake 問題,透過 Nano Banana Pro 創建的圖像將會嵌入 C2PA 元數據 (metadata) 。這將有助於外界辨識內容是否由 AI 生成 。

在收費模式上,Nano Banana Pro 實際上是免費開放使用的 。免費與戶將設有每日生成圖像配額,而 Google AI、Plus、Pro 與 Ultra 的訂閱用戶則享有更高的額度 。

使用者僅需開啓 Gemini App 並確保使用「Thinking」模型即可進行創作 。此外,部分訂閱用戶也可在 Search 與 NotebookLM 中使用此功能 。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》