5 min read
Gemini 20 Flash这么强,还有必要学ComfyUI吗?还要美工吗?

【AI 辅助设计】Gemini 2.0 Flash 这么强,还有必要学 ComfyUI 吗?还要美工吗?
前言
不是标题党,在前几天发布的 Gemini 2.0 Flash ,可以实现自然语言方式,进行画图、修图、融图、风格迁移、输出漫画等等,几乎主流的 AI 出图、修图所能触达的功能,都有所涵盖,只是当前的质量如何,大家还在尝试中。 这完全就是一个自然语言版且极致易用的、集合所有 AI 武器、货真价实的“拿你命三千”😂。
对了,这张梗图,也是用 Gemini 2.0 Flash 修改文字的,就一句话:“Add a caption to the image: “Gemini 2.0 Flash”. In the image content area, there are some logos distributed and arranged, including OpenAI, Pika, Midjourney, Claude, Google, etc.”。
本文,将搜罗互联网上或自己测试(非完整测试)的案例,感兴趣的朋友们也不妨思考一下: 学 ComfUI 还有必要吗?普通的美工(仅限于普通)如何在 AI 时代得以生存?🤔
完整的图像处理功能
基础文生图
A model with bright blue eyeliner and pink lipstick, against a vibrant pink background, exuding confidence in the makeup look she is wearing. The model has her eyes closed to highlight their natural beauty under soft lighting. Her hair, styled neatly to frame her face, adds an extra touch of elegance to the overall composition. This shot captures the essence of high-fashion makeup artistry,
A rainbow-colored plush shark, swimming in the ocean, with a kawaii aesthetic. It's cute, and Koreans play with it. The shark is fluffy, with pastel colors, in the style of Korean anime.
A beautiful Japanese woman in her late 20s,Soft morning light illuminates her natural complexion without makeup, salt-crystallized hair strands glowing with bioluminescent plankton. Wearing oversized hemp shirt dissolving into sea mist, submerged fabric creating liquid morphing effects around her torso. Shot on Hasselblad 503CW with 120mm lens using Fuji Acros 100 B&W film, extreme close-up capturing individual water droplets sliding down neck contours, eyes reflecting horizon line where dawn meets night. No jewelry or accessories, pure focus on organic interaction between human form and elemental forces, subtle shoulder tension suggesting emerging strength
🤔还是非常不错的,对提示语的遵循都很高!但是图片的美感不如 MJ,画面质感不如 FLUX 呢。
最后一个提示语为例,Midjourney 和 FLUX 的表现:
Midjourney
FLUX
移除万物
remove the bottle
remove the bear toy
只能说“厉害!”🐂🍺。当然,细节上会有些瑕疵。
局部重绘 inpainting
the girl wearing a black sunglasses
换装试试。
this girl with red cloth
来个组合拳。
the girl wearing Qipao,long hair,smiling,
结果是全部变了,所以这个功能需要一个个地方改。
风格迁移(类似 Redux+IPA)
Create different poses and expressions based on the image of the girl in the picture
角色脸部稍微有点变形了,但是基本按照提示语处理好。
Using the style of the image, draw a portrait of Elon Musk
有意思!👍
扩图 outpinting
Expand the image to a 2:1 ratio
抠图
remove background of this image
应用场景
应该来说,现在讨论的所有关于 ComfyUI 应用的场景,Gemini 2.0 Flsh 都可以适用!
电商-试穿
来自 @HalimAlrasihi
可以组合穿搭:
电商摄影-多角度模特
来自@AiFreak_tool 的分享:
最后他用 keling 做了个视频,非常 nice!
电商:产品+模特
来自:@indigo 11
来自:@onofumi_AI
来自:@KurawaDono
将产品通过模特展示。
电商:产品变体
来自:@onofumi_AI
左上角是原始图像。简单的提示可以让您打开和关闭门以及更改车轮颜色。只需点击一下,效果惊人
设计:创意融合
来自:@literallydenis
游戏:制作游戏地图
来自:@victormustar
自媒体-图文创作
提示语:
以:“这大概是中国人才懂的意境...”为题目,创作一篇图文并茂的文章。
真图文并茂!
写在最后-我的观点
还有很多应用场景,就不一一举例了,大家可以去体验一下。 基于我的观察,我也尝试抛出自己的观点,不一定对:
工具生态重构
ComfyUI等专业工具正在经历价值转型:从必备生产工具转变为精密调控器。如同摄影从暗房到数码的演进,专业工具将转向满足1%的极致需求,而Gemini类平台将承载99%的基础创作。
其实可以扩展到当前涌现的 AI 智能体,最终都会内化为大模型的形态!
美工职业进化
基础美工岗位将经历三大转型:
- 指令工程师:掌握跨模态提示词设计
- AI策展人:建立审美评估体系与风格库
- 人机协同师:精通多工具链组合应用
技术演进预测
- 生物拟态突破:凯文·凯利的预言正在应验,AI系统展现出类生命体的自我迭代特性
- 全息创作界面:未来3年或将出现AR+AI的沉浸式创作空间
- 情感化输出:情感计算技术的融入将催生更具人文温度的创作
设计师怎么办?
当技术民主化浪潮席卷而来,真正的竞争力将回归到:
- 审美判断力的深度培养
- 文化洞察的独特视角
- 创意元问题的提出能力
想获取更多 AI 辅助设计和设计灵感趋势? 欢迎关注我的公众号(设计小站):sjxz 00。