科技

Google推出「Nano Banana Pro」影像生成平台,整合Gemini 3模型、強化文字渲染與14張圖合成能力

編輯部
15天前
12 瀏覽
Google推出「Nano Banana Pro」影像生成平台,整合Gemini 3模型、強化文字渲染與14張圖合成能力
Google 稍早揭曉代號為「Nano Banana Pro」、同時也被稱為 Gemini 3 Pro Image 的全新影像生成平台 。官方強調此版本基於近期推出的 Gemini 3 模型架構 ,在各方面均較前代軟體有所提升,號稱能將使用者的願景轉化為具備「前所未有的控制力、完美的文字渲染與增強的世界知識」的「工作室等級設計」。

此次升級的一大重點在於文字渲染 (text rendering) 能力。Nano Banana Pro 被賦予了製作內容豐富的資訊圖表 (infographics) 與圖解 (diagrams) 的能力 。

軟體現在能夠在既有圖像上渲染出清晰可讀的文字,使其成為生成海報等素材的理想工具 。Google 也表示,此功能目前已支援多種語言,其中也包含台灣使用的繁體中文,甚至能正確呈現中文字結構。

在編輯與合成方面,Google 表示新平台能將多個元素融合為單一作品,並且具備一次使用多達 14 張圖像進行合成的能力 。

此外,Nano Banana Pro 也導入了豐富的編輯控制選項。使用者可以選取並編輯生成圖像中的任何部分,功能涵蓋調整相機角度、改變對焦點、調整色彩分級 (color grade),甚至能直接將場景的光線從白天轉換為夜晚 。

在相關測試中,Nano Banana Pro 不僅能正確依照文字描述生成圖像,甚至也不會出現過往「酒杯難以裝滿酒」、「時鐘指針難以指向正確時間」等問題。

為了應對生成式 AI 內容識別與 Deepfake 問題,透過 Nano Banana Pro 創建的圖像將會嵌入 C2PA 元數據 (metadata) 。這將有助於外界辨識內容是否由 AI 生成 。

在收費模式上,Nano Banana Pro 實際上是免費開放使用的 。免費與戶將設有每日生成圖像配額,而 Google AI、Plus、Pro 與 Ultra 的訂閱用戶則享有更高的額度 。

使用者僅需開啟 Gemini App 並確保使用「Thinking」模型即可進行創作 。此外,部分訂閱用戶也可在 Search 與 NotebookLM 中使用此功能 。

更多Mashdigi.com報導:

蘋果的3D列印鈦金屬技術細節:Apple Watch S11與 Ultra 3錶殼原料減半、為iPhone Air超薄設計鋪路

微軟、NVIDIA合計注資150億美元押寶Anthropic,讓AI產業錯綜複雜的「循環投資」現象更加明顯

Google正式揭曉Gemini 3:集大成之作,以「Google Antigravity」打造代理AI開發新基地

新聞來源: 原始來源

約 2 分鐘可讀完
分享

讀者評論 (0)

尚無評論

成為第一個發表評論的人吧!

首頁 新聞 商家 活動 聊天底