作者error405 (流河=L)
看板AI_Art
标题Fw: [新闻] Gemini 3 Pro Image:「Nano Banana Pro
时间Fri Nov 21 08:15:38 2025
※ [本文转录自 Stock 看板 #1f7qfhFx ]
作者: empliu (Liu) 看板: Stock
标题: [新闻] Gemini 3 Pro Image:「Nano Banana Pro
时间: Fri Nov 21 01:05:41 2025
原文标题:
Gemini 3 Pro Image:「Nano Banana Pro」重新定义 AI 影像生成
原文连结:
https://o3o.us/dKrxQ7
发布时间:November 21, 2025
记者署名:TechApple.com 编辑部
原文内容:
在生成式 AI 竞争白热化的当下,Google DeepMind 再次抛出重磅更新。全新影像生成引
擎——Gemini 3 Pro Image,其核心驱动更是被命名为极具话题性的 「Nano Banana Pro
」。这不仅是画质的提升,更是对「精准控制」与「工作室级品质」的一次全面宣战。在
Google AI Studio和AI Studio已经上线,注意有部份地区未必能用。
工作室级的精准控制:从「抽卡」到「设计」
过去的 AI 绘图往往被戏称为「抽卡」,但在 Nano Banana Pro 的加持下,Gemini 3
Pro Image 将重点完全转向了 「Studio-quality control(工作室级控制)」。
这款模型的核心承诺在於「对影像的每一个细节进行精细控制」。这意味着创作者不再需
要反覆尝试随机的 Prompt,而是能够真正像使用专业软体一样,对画面进行精确的调度
。
角色与场景的完美融合
对於叙事类创作者而言,最大的痛点莫过於角色的一致性。Gemini 3 Pro Image 在这方
面展现了强大的能力。官方资料明确指出,使用者可以 「将你的角色放入全新的场景中
,并更换新的服装」。这一功能直接打破了过去 AI 生成中「换个场景就换张脸」的魔咒
。
更进一步,它支援 「混合多张参考图像」,并能构建出保留了选定细节的复杂构图。这
不仅仅是简单的拼贴,而是能够协助创作者 「在一系列影像中勾勒出完整的故事」。从
单图生成进化到连贯叙事,这是 AI 进入专业工作流的关键一步。
突破文字与知识的边界:海报与图表的终极解决方案
长期以来,AI 在生成图片中的文字时总是「力不从心」,出现乱码或拼写错误是家常便
饭。Gemini 3 Pro Image 对此进行了针对性的优化。
清晰的文字生成能力
DeepMind 强调,新模型能够 「为海报和复杂图表生成清晰的文字」。这对於平面设计师
和行销人员来说是一个巨大的福音。你不仅可以直接生成带有正确标语的海报,甚至可
以 「将你的设计翻译成不同的在地化语言」。这意味着,一个设计稿可以快速裂变为适
应全球不同市场的版本,极大地提升了跨国行销的效率。
基於现实世界的知识库
除了文字,模型的「脑子」也更好用了。利用 Gemini 庞大的现实世界知识,该模型能够
交付 「精确的结果」,这在生成 「复杂的资讯图表」 或 「历史精确的场景」 时尤为
重要。它不再是凭空捏造,而是基於数据和事实进行视觉化呈现,这让它在教育和专业简
报领域的应用潜力大增。
强大的後期编辑流:修复、光影与混合
Gemini 3 Pro Image 不仅是一个生成器,更是一个强大的编辑器。它引入了进阶的创意
工作流支援,让使用者可以 「测试想法、创建引人注目的设计并制作原型」。
多模态的理解与编辑
透过 「上传图像并分享文字指令」,使用者可以用最自然的语言与 AI 沟通。想要微调
?没问题。你可以利用其 「多模态理解(Multimodal understanding)」 能力,对画面
进行复杂且详细的修改。
高阶编辑功能
官方特别提到了几个令人印象深刻的高阶功能:
遮罩编辑(Masked editing): 对特定区域进行精准修改。
大幅度光影变换: 例如直接将画面从 「白天变为黑夜」,这需要模型对光线物理有极深
的理解。
影像混合: 将不同素材无缝拼接,创造出全新的视觉体验。
这些功能让 Gemini 3 Pro Image 能够承担起「修图师」的角色,而不仅仅是「画师」。
诚实的技术报告:不回避缺陷的透明度
与许多过度包装的 AI 产品不同,DeepMind 在发布页面上展现了难得的技术诚实,详细
列出了模型目前的局限性。这种「自我揭短」反而增加了专业用户的信任度。
目前的技术瓶颈
尽管冠以 “Pro” 之名,官方坦承 「并非 Gemini 生成的每张图像都是完美的」。以下
是目前仍可能遇到的挑战:
细节处理: 模型在处理 「小脸(small faces)」、「准确拼写」 以及影像中的 「精
细细节」 时仍可能感到吃力。
复杂数据的误读: 虽然拥有丰富的知识,但在生成 「资讯图表、标注图表或呈现复杂数
据」 时,它可能会 「误解资讯或产生与事实不符的结果」。官方强烈建议使用者 「务
必验证数据驱动的输出结果」。
语言与文化的隔阂: 虽然支援多语言翻译,但在 「语法、拼写、文化细微差别或成语
」 方面仍可能遇到困难。
物理逻辑的瑕疵: 在进行如「日夜变换」或「影像混合」等高阶操作时,有时会产生 「
不自然的结果、视觉伪影或不连贯的场景」。
心得/评论:
Google高层前几天就有预告
前天的Gemini 3发布只是前菜而已
今天在图像领域发表新的香蕉Pro出来炸场了
补一个我在FB中文社群看到极可怕的案例
入门级的美编这个周末夜难眠了
汉化组/台湾出版翻译漫画看过吧
来自 Jas Chiang
https://i.imgur.com/Vk4RlEi.mp4
真的变态的可怕
下面的案例感受一下
ChatGPT 888
按摩椅广告图(burri3188)
https://i.imgur.com/6BOGzPH.png
https://i.imgur.com/6D04xqA.png
Threads 室内设计师 33.shan.design 拿图做渲染
https://i.imgur.com/drW90TN.jpeg
https://i.imgur.com/zbRtybW.jpeg
广告图解说(burri3188)
https://i.imgur.com/X9XIaRC.png
https://i.imgur.com/iRNx1VJ.png
家常便当菜随手拍
https://i.imgur.com/dsW95kd.png
https://i.imgur.com/zGcNZlm.png
广告图
https://i.imgur.com/KPFF64Z.jpeg
===
这是我自己在路边摊拍的卤肉饭
https://i.imgur.com/eOxnl7M.png
请帮我生成专业的广告照
https://i.imgur.com/tA6TETn.png
请让金城武代言这碗卤肉饭
https://i.imgur.com/ohT85GX.png
其他案例
出师表+石牌
https://i.imgur.com/leh3cW7.jpeg
饶河夜市+妹子
https://i.imgur.com/GOcRyhF.png
吹风机广告
https://i.imgur.com/NjSlNuu.png
https://i.imgur.com/QUFwmEq.png
https://i.imgur.com/2uRfcBu.png
https://i.imgur.com/bBpZPXL.jpeg
手冲咖啡图 by Fox Hsiao
提示词 : "请画出一张手冲咖啡流程图附上简单说明,日本流行杂志风格,但是说明文字
是台湾繁体中文"
https://i.imgur.com/EWUnPKn.png
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 212.102.40.177 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1763658347.A.3FB.html
1F:推 leon1757tw : AI为什麽要加香菜 11/21 01:06
2F:推 Lenney33 : 干嘛偷拿我的照片 11/21 01:07
3F:推 joshddd : 这边鲁猪肉了吧 11/21 01:09
4F:推 cdplay000 : 要钱吗,免费可以用吗 11/21 01:10
5F:→ baka1412 : 变控肉饭 11/21 01:11
https://i.imgur.com/9dDCVHZ.png
他好像很热衷把卤肉饭变成控肉饭=_=
6F:→ cdplay000 : 如果免费,那GPT就GG 11/21 01:11
7F:推 karta018 : 可以色色吗 11/21 01:12
8F:推 cloud1030 : NV 丸子 11/21 01:13
9F:→ orz811017 : 大安金城武表示愤怒 11/21 01:13
10F:推 fr75520 : 各方金城武集结 11/21 01:16
11F:→ lianli1024 : 这灌水太严重了 11/21 01:18
12F:推 cityport : 香菜也太假了吧 11/21 01:20
13F:→ cityport : 焢肉跟鸡蛋也很假 11/21 01:21
14F:推 strlen : 香菜怎摸惹?香菜很好啊 11/21 01:22
15F:推 b2209187 : 这个算小控肉或红烧肉饭,不过有些高级饭店的卤味 11/21 01:23
16F:→ b2209187 : 饭确实是这种型态 11/21 01:23
17F:推 permanent27 : 我迷人的笑容 11/21 01:23
18F:推 suPerFlyK : 做报告 超级好用 11/21 01:29
19F:推 iverboy : 生成图,openai还是更好 11/21 01:42
20F:→ Tatsuya72 : 图文不符,这样拿去商业运用跟欺诈有甚麽不同? 11/21 01:42
21F:→ iverboy : 这openai只好继续加码了,最後会不会卖给微软 11/21 01:42
22F:→ Tatsuya72 : 哪个客户会接受这样搞 不怕被告? 11/21 01:43
23F:推 baka1412 : 饿 11/21 01:54
24F:推 abcd255060 : 加香菜真赞 AI很懂! 11/21 01:55
25F:推 ksjr : 为什麽要加两盘辣椒酱 11/21 02:23
26F:嘘 a8785007 : AI 只有这种可以发挥? 11/21 02:24
补了一些案例
入门级的美编这个周末夜难眠了
汉化组/台湾翻译漫画看过看过吧
来自 Jas Chiang
https://i.imgur.com/Vk4RlEi.mp4
27F:推 shirleyEchi : 这满满的AI味 11/21 02:39
※ 编辑: empliu (212.102.40.177 美国), 11/21/2025 03:06:29
28F:嘘 ryan8409 : 一看就是AI文 11/21 04:22
29F:推 bio5chris : 确实是grok弱点但我生成完美奶子时并不在意文字啥的 11/21 04:24
30F:推 gnnlcb : open光金城武就卡关,哪里强 11/21 04:28
31F:推 zero00072 : 你还在宫崎骏,人家直接金城武。 11/21 05:34
32F:→ greedypeople: 现在确实是gemini最强 但就跟海浪法师说的一样 11/21 05:59
33F:→ greedypeople: 暂时的 11/21 05:59
34F:→ ksjr : 不过3pro转好久 虽然我免费仔 11/21 06:08
35F:嘘 kevabc1 : 笑死 那卤肉饭明明就超强 肉燥饭还加鱼松的超恶心好 11/21 06:17
36F:→ kevabc1 : 吗(误 11/21 06:17
37F:推 bleeza : nano banana不就是奈米屌吗 11/21 06:26
38F:推 loleea : 会让人失业,然後失业率上升 市场就崩了 11/21 07:35
39F:推 kausan : 美术的要掰了 11/21 08:01
40F:→ kausan : 连设计的也岌岌可危 11/21 08:02
※ 发信站: 批踢踢实业坊(ptt.cc)
※ 转录者: error405 (114.36.233.115 台湾), 11/21/2025 08:15:38
41F:→ iman00b: 那个谁用我的肖像卖卤肉饭没经过本人同意 11/21 10:08
42F:推 SSglamr: 卤肉饭变控肉饭不能接受 11/21 10:40
44F:嘘 D600dust: 你真的觉得这食谱可以让谁失业吗... 11/22 08:17