5 min read
就在昨天!OpenAI扔出了一个王炸

【AI前沿】就在昨天!OpenAI扔出了一个王炸
前言
还是记得前不久 Google 发布的集成多种武器于一身的 Gemini 2.0 吗?【AI 辅助设计】“拿你命三千”-Gemini 2.0 Flash 强炸裂登场!。几乎把市面上所有图像处理方面的 AI 能力都集成进来了。 就在昨天,OpenAI 连夜发布了新的多模态模型,可以说把图像处理方面的能力推向了新的高度!。
也许大家都看到他的厉害之处了,设计小站也整理了一些信息,供大家参考。
以下信息整理自互联网。我尝试归纳一些特性,这些特性在当前 AI 生图领域,无论开源的 FLUX 还是闭源的 Midjourney 都望其项背的。
文字表现天花板
OpenAI 图像模型,对于文字的表现非常优秀,几乎完美还原了文字,对中文的支持也很好(目前还有些问题)!
来自官方的案例,无论场景还是机票上的文字信息,都还原了现实世界了。
来自:@sharqwy。在黑板上字清晰可见,且具有意义。
提示语:
"A whide image taken with a phone of a glass whiteboard, in a room overlooking the Bay Bridge. The field of view shows a woman writing, spotting a t-shirt with a large OpenAI logo. The handwriting looks natural and a bit messy, and we see the photographer's vague reflection"
来自:@alliekmiller。四格漫画不在话下!
有意义的漫画:
甚至写一份菜单:
来自:@tinyfool。梗图制作神器!
风格迁移高手
全网都在玩的吉卜力重绘风格。
来自:@0xAllen_
来自:@bilawalsidhu。漫画转写实,就真的很写实!
甚至可以模拟软件界面?还保留角色的一致性?😮
来自:@the_gonchar
UI 设计和绘制
来自:@genikarriqi
提示语:
Create a modern mobile app interface
🤯这设计质量!不得不服!
来自:@op7418 歸藏(guizang.ai) 老师。 不要怀疑,这就是新模型画的!😲还原度很高!如果再加上前端代码,是不是一句话可以完成前端页面了?🤔
图标的绘制。这质感拉满了啊~😂 来自:@tualatrix
来自:sixichacha,把苹果 WWDC 2025 的图标风格迁移。
经过处理后:
啊!这品质,这感觉!很顶!
换场景和元素
来自:@LudovicCreator。 在 ComfyUI 探讨如何换背景的技术,是不是可以停止了…😂。这个案例,把产品主体放在不同的天气中。
来自:@HBCoop_
将她的 banner 放在时代广场的大屏幕上。
线稿生成效果图
来自:kakueku
角色一致性迁移
来自:@ilanbigio
把照片换个动作并保持人物不变。
其他
医学参考图?
来自:@Vox_Oculi
使用方法
目前只限于 plus 会员使用,官方说不久将会开放 API:
写到最后,最近 Google 和 OpenAI 的更新,真的让人,感觉到了,在AI 图像处理领域,逐步会抛弃掉复杂的流程,内化为大模型。其对话式的交互,也在还原最真实最直接最自然的的互动。
想获取更多 AI 辅助设计和设计灵感趋势? 欢迎关注我的公众号(设计小站):sjxz00。