隨著 Gemini 3 系列的推出,Google 進一步強化圖像生成和編輯模型成為「Nano Banana Pro」、也就是 Gemini 3 Pro Image 模型,大幅提升 Gemini 在資訊視覺化、文字及視覺效果的處理能力。
Nano Banana Pro 根據你提供的提示詞或真實世界的事實,還能連結 Google 搜尋龐大的知識庫,生成內容豐富的資訊圖表和圖解,像是協助你快速製作食譜摘要,或將天氣、體育賽事等資訊視覺化。

過往圖像生成模型在文字處理方面表現差強人意,偶爾出現文字錯誤或字型扭曲等狀況。Google 稱 Nano Banana Pro 是目前在圖像中直接呈現正確渲染且清晰文字的最佳模型,你可以在產品打樣或海報設計加入豐富細節的文字,並運用多樣化的紋理、字體及書寫風格來呈現。此外,你可以生成多種語言的文字,或將翻譯內容,以便拓展國際市場。
透過 Nano Banana Pro 進行圖像生成,能夠融合比以往更多的元素,最多使用 14 張參考圖像,並保持多達 5 個人物的一致性與相似度。經過改善的局部編輯功能,你可以選擇、微調及轉換圖像的任何部分,例如調整相機角度、改變焦點並應用細緻的調色,甚至轉換場景光線(將白天改成黑夜、創造散景效果)。Nano Banana Pro 為圖像提供多種長寬比選擇以及可用的 2K、4K 解析度,從社群媒體到印刷品你的創作都有發揮空間。

Nano Banana Pro 提示詞訣竅
從設計產品原型、將數據轉化為資訊圖表、或將手寫筆記轉變為圖表等,你都能在 Gemini 應用程式使用 Nano Banana Pro。為了獲得最佳效果並擁有更精細的創作控制權,提示詞方面應盡量確立你的故事、主題及風格,同時考慮構圖和長寬比、攝影和燈光細節等要素
Google 提出七個提示詞訣竅,幫助你透過 Nano Banana Pro 生成圖像:
- 生成具有驚人文字渲染效果的視覺內容:嘗試加入清晰、易讀的文字,幫助你建立吸引目光的海報、複雜的圖表、甚至是細緻的產品原型。
- 利用真實世界知識進行創作:Nano Banana Pro 是以 Gemini 3 Pro 為基礎,利用 Gemini 3 的真實世界知識和深度推理能力,可提供精確、詳細且豐富的圖像生成結果。
- 翻譯並在地化你的想法:Nano Banana Pro 可產生在地化的文字,也能翻譯圖像中的文字。嘗試產品在多種語言下的可能性,為進軍海外市場做準備,並為不同地區製作海報和資訊圖表。
- 利用影像工作室等級的控制編輯:可對光線和相機設定加以控制,例如拍攝角度、焦距、色彩分級等。
- 精確調整大小:嘗試不同的長寬比,並針對各種產品生成 1K、2K、4K 解析度的清晰視覺效果。
- 融合圖像並保持多個角色的一致性:即使多個角色同時出現,Nano Banana Pro 也能保持它們的一致性和相似性。可以融合多達 6~14 張(輸入數量因平台而異)完全不相關的圖像,進而創造出全新的內容。
- 創建並維護品牌形象:Nano Banana Pro 可渲染並應用具有一致品牌風格的設計,輕鬆將概念視覺化。將圖案、標誌及藝術作品無縫覆蓋在 3D 物體表面,同時保留自然的照明和紋理。
如何體驗最新 Nano Banana Pro
Gemini 應用程式將是最便於使用 Nano Banana Pro 的管道,Google 在全球的 Gemini 應用程式陸續推出這項功能,只需要在選擇「思考型」模型使用「影像」功能即可。其中,免費版用戶將獲得有限制的免費額度,用完將恢復前一代 Nano Banana,Google AI Plus / Pro / Ultra 訂閱用戶則享有更高的額度。
開發者與企業客戶可以透過 Gemini API 和 Google AI Studio 存取 Nano Banana Pro,而在新推出的 Google Antigravity 用於建立豐富的 UX 版面配置與樣機。企業客戶可在 Vertex AI 進行大規模創作,而且即將支援 Gemini Enterprise。
Google 廣告中的影像生成功能也升級至 Nano Banana Pro,將最尖端的創意與編輯能力直接帶給全球廣告主,在 Google 簡報和 Vids 也向 Google Workspace 客戶推出這項功能。Google AI Ultra 訂閱用戶可在 Flow 中使用這項功能,賦予創意人士、電影製作人及行銷人員對畫面與場景更精確的控制力。
(圖片來源:Google Blog)






