5分钟阅读
Google官方AI辅助设计工具:Nano Banana Pro 全面使用指南
这款下一代AI模型具备思维能力、搜索接地和高清4K输出等高级功能,本文将带您探索它如何助力您打造复杂且富有创意的应用。基础版Flash模型(Nano Banana)以速度和高性价比为核心优势,而Pro版本则新增了“思维”能力、搜索接地和高保真4K输出功能。是时候用它攻克复杂创意任务了!
本文将通过以下内容带您全面掌握Nano Banana Pro的高级功能:
- 在Google AI Studio中使用Nano Banana Pro
- 项目设置
- 初始化客户端
- 基础生成功能(经典用法)
- “思维”过程解析
- 搜索接地功能
- 高分辨率4K生成
- 多语言支持能力
- 高级图像混合功能
- Pro专属演示案例
- 最佳实践与提示技巧
普通用户可通过 Google AI 平台 使用Nano Banana Pro,而开发者原型设计和提示词测试的最佳环境是 Google AI Studio。AI Studio是一个无需编写代码即可测试所有可用AI模型的实验平台,也是使用Gemini API进行开发的入口。
1. 在Google AI Studio中使用Nano Banana Pro
- 访问 Google AI Studio官网,使用Google账号登录
- 在模型选择器中选择“Nano Banana Pro(Gemini 3 Pro Image)”
提示:您也可以通过 AI Studio代码编辑器 直接编写Nano Banana Web应用,或浏览官方示例代码 并进行二次开发。
与基础版Nano Banana不同,Pro版本无免费额度,因此需要选择已启用计费功能的API密钥(详见下方“项目设置”部分)。
2. 项目设置
前置要求
- 已为项目配置计费功能
- 安装适用于Python或JavaScript的Google Gen AI SDK
若您已是资深Gemini API用户且已完成上述配置,可直接跳过本节;否则按以下步骤操作:
步骤1:获取API密钥
首次登录AI Studio时,系统会自动创建Google Cloud项目和API密钥。打开 API密钥管理页面,点击“复制”图标获取API密钥。
步骤2:启用计费功能
由于Nano Banana Pro无免费额度,需为Google Cloud项目启用计费。在计费设置页面,点击项目旁的“设置计费”,并按照屏幕提示完成操作。
费用说明
Nano Banana Pro的图像生成成本高于Flash版本,尤其是4K图像。本文发布时的计费标准如下:
- 1K/2K图像:$0.134/张
- 4K图像:$0.24/张(另加输入和文本输出的令牌费用)
最新费用详情请查看官方文档。
专业提示:使用批量API 可节省50%的生成成本,但需等待最长24小时获取图像,请根据需求选择。
步骤3:安装SDK
根据您偏好的编程语言选择对应的SDK:
Python:
pip install -U google-genai
# 安装用于图像处理的Pillow库
pip install Pillow
JavaScript:
npm install @google/genai
注意:以下示例使用Python SDK演示,JavaScript对应的代码片段可查看官方文档。
3. 初始化客户端
使用Pro模型需指定模型ID为“gemini-3-pro-image-preview”,代码示例如下:
from google import genai
from google.genai import types
# 初始化客户端
client = genai.Client(api_key="YOUR_API_KEY")
# 设置模型ID
PRO_MODEL_ID = "gemini-3-pro-image-preview"
4. 基础生成功能(经典用法)
可通过 response_modalities(控制输出文本+图像或仅图像)和 aspect_ratio(控制宽高比)参数调整输出效果:
prompt = "创建一张写真级图像:一只左眼绿色、右眼蓝色的暹罗猫"
aspect_ratio = "16:9" # 可选值:"1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9" 或 "21:9"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'], # 或仅指定 ['Image']
image_config=types.ImageConfig(
aspect_ratio=aspect_ratio,
)
)
)
# 保存图像
for part in response.parts:
if image:= part.as_image():
image.save("cat.png")
提示:也可使用聊天模式进行多轮编辑,详见第8节“多语言支持能力”的示例。
5. “思维”过程解析
Nano Banana Pro不仅能生成图像,还具备“思维”能力——它会先解析复杂提示词,再进行创作。更重要的是,您可以查看它的“思考过程”!
只需在 thinking_config 中设置 include_thoughts=True 即可启用该功能:
prompt = "创建一张独特但真实的、可能会走红的图像"
aspect_ratio = "16:9"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio=aspect_ratio,
),
thinking_config=types.ThinkingConfig(
include_thoughts=True # 启用思维过程输出
)
)
)
# 显示图像和思维过程
for part in response.parts:
if part.thought:
print(f"思维过程:{part.text}")
elif image:= part.as_image():
image.save("viral.png")
示例输出(思维过程):
## 构想美洲驼通勤者
我现在聚焦于美洲驼的形象设计。目标是捕捉它们在玻利维亚拉巴斯市一辆繁忙公交车上的日常通勤场景。我的计划是:一辆复古公交车里挤满了饶有兴致的乘客,重点突出细节——比如一只美洲驼望向窗外,另一只与乘客互动,同时其他人在拍照记录。
## 视觉化概念
我已完全沉浸在需求场景中。核心聚焦“独特但真实”的特点,关键元素已初步成型。
这种透明化的思维过程能帮助您理解模型对需求的解读,就像与创作者直接对话一样!
6. 搜索接地功能
这是最具颠覆性的功能之一——Nano Banana Pro可接入Google搜索获取实时数据,生成准确、最新的图像。例如,您可以让它可视化实时天气预报:
prompt = "以简洁现代的气象图表形式,展示东京未来5天的实时天气预报,并添加每日穿搭建议的视觉元素"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio="16:9",
),
tools=[{"google_search": {}}] # 启用Google搜索
)
)
# 保存图像
for part in response.parts:
if image:= part.as_image():
image.save("weather.png")
# 显示数据来源(必须执行此步骤)
print(response.candidates[0].grounding_metadata.search_entry_point.rendered_content)
7. 高分辨率4K生成
需要印刷级图像?Nano Banana Pro支持4K分辨率,满足高质量输出需求:
prompt = "一张展示橡树经历四季变化的照片"
resolution = "4K" # 可选值:"1K", "2K", "4K"(注意:小写不生效)
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio="1:1",
image_size=resolution
)
)
)
注意:4K生成成本较高,请合理使用!
8. 多语言支持能力
该模型可生成并翻译图像中的文本,支持超过12种语言,堪称视觉化的“万能翻译官”。
示例1:生成西班牙语信息图
# 初始化聊天模式
chat = client.chat(
model=PRO_MODEL_ID,
messages=[],
generation_config=types.GenerateContentConfig(
response_modalities=['Text', 'Image']
)
)
# 生成西班牙语的广义相对论信息图(适合6年级学生)
message = "制作一张解释爱因斯坦广义相对论的信息图,适合6年级学生理解,语言为西班牙语"
response = chat.send_message(message, config=types.GenerateContentConfig(
image_config=types.ImageConfig(aspect_ratio="16:9")
))
# 保存图像
for part in response.parts:
if image:= part.as_image():
image.save("relativity.png")
示例2:翻译为日语
# 将信息图翻译为日语,保持其他元素不变
message = "将这张信息图翻译为日语,其他所有内容保持不变"
response = chat.send_message(message)
# 保存图像
for part in response.parts:
if image:= part.as_image():
image.save("relativity_JP.png")
9. 高级图像混合功能
基础版Flash模型最多可混合3张图像,而Pro版本支持最多14张图像混合!非常适合创建复杂拼贴画或展示全系列产品:
from PIL import Image
# 混合多张图像
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=[
"这几个人的办公室合影,他们都在做鬼脸",
Image.open('John.png'),
Image.open('Jane.png'),
# ... 最多可添加14张图像
],
)
# 保存图像
for part in response.parts:
if image:= part.as_image():
image.save("group_picture.png")
注意:若需人物形象保持高保真,建议最多混合5张图像——这已足够满足大多数场景需求!
10. Pro专属演示案例
以下是仅Nano Banana Pro能实现的创意案例,带您感受其强大能力:
案例1:基于实时数据的等距像素画
提示词:“搜索网络,生成一幅等距视角的精细像素画,展示Guillaume Vernade的职业生涯”
该案例通过搜索接地获取人物具体信息,并以指定风格可视化呈现。
案例2:带文学分析的十四行诗信息图
提示词:“制作一张关于十四行诗创作原理的信息图,包含一首以香蕉为主题的十四行诗,以及对该诗的详细文学分析,采用复古美学风格”
模型能生成连贯的长文本,并完美整合到复杂布局中。
案例3:百老汇演出节目单mockup
提示词:“一张TCG玩家主题百老汇演出的节目单照片,放置在舒适的剧院座位上,设计专业精良、带有光泽感,能看到封面和展示舞台照片的内页”
可生成具有真实光影和纹理的印刷品模拟图。
11. 最佳实践与提示技巧
要充分发挥Nano Banana模型的潜力,建议遵循以下提示词设计原则:
- 极致具体:详细描述主体、颜色、光线和构图,对输出的控制力更强
- 提供背景与意图:说明图像的用途或期望的氛围,模型对背景的理解会影响创意选择
- 迭代优化:不要期望一次生成完美结果,利用模型的对话能力逐步调整和完善图像
- 分步指令:对于复杂场景,将提示词拆分为清晰的顺序指令
- 正向描述:避免使用“没有汽车”等负面提示,改为正向描述:“一条空旷无人、无交通痕迹的街道”
- 控制视角:使用摄影和电影术语指导构图,如“广角镜头”“微距拍摄”“低角度视角”
- 善用搜索接地:需要实时/真实世界数据时,描述要精准。例如“搜索里昂奥林匹克队上一场比赛的信息并制作信息图”比“里昂队上一场比赛的信息图”效果更好
- 使用批量API节省成本:批量发送请求(最多24小时处理完成)可节省50%成本,且配额更高
如需深入了解最佳实践,可查看官方文档 和官方博客 发布的Nano Banana专属指南。
总结
Nano Banana Pro(Gemini 3 Pro Image)为AI图像生成开辟了新领域,其思维能力、搜索功能和4K渲染能力,使其成为专业创作者的得力工具(也能带来十足乐趣)。
准备好体验了吗?立即访问 Google AI Studio,尝试官方演示、自定义示例代码 或查看 API文档。
更多 AI 前沿技术与设计灵感,欢迎关注「设计小站」公众号(ID:sjxz00),一起探索科技与设计的融合创新。