5分钟阅读
告别抠图噩梦!阿里开源「AI版PS」,一键智能分层,设计师狂喜
告别抠图噩梦!阿里开源「AI版PS」,一键智能分层,设计师狂喜
前言
对于设计师而言,图层是创作的基石,是灵感的容器,也是无数次修改的见证者。然而,面对一张复杂的合成图像或AI生成的精美画面,想要精准分离其中的元素进行二次编辑,往往意味着耗时费力的手动抠图。现在,这个痛点有望被彻底解决。阿里通义千问团队刚刚开源了Qwen-Image-Layered模型,它能像Photoshop一样,智能地将一张图片分解成多个可独立编辑的RGBA图层。这不仅是技术的突破,更是对设计工作流的革命性重塑。

正文
模型介绍
🎨 Qwen-Image-Layered 正式发布 —— 原生图像分层,完全开源!
✨ 为何它如此出众? ✅ Photoshop级别的分层能力 生成物理隔离的RGBA图层,具备真正的原生可编辑性。 ✅ 提示词控制结构 可明确指定生成3-10个图层,从粗略布局到精细细节,尽在掌控。 ✅ 无限分解潜力 持续深入:图层之中还有图层,可挖掘至任何细节深度。
资源直达: 🤗 Hugging Face: https://huggingface.co/Qwen/Qwen-Image-Layered 🧩 ModelScope: https://modelscope.cn/models/Qwen/Qwen-Image-Layered 💻 GitHub: https://github.com/QwenLM/Qwen-Image-Layered 📝 官方博客: https://qwen.ai/blog?id=qwen-image-layered 📄 技术报告: https://arxiv.org/abs/2512.15603 🚀 在线体验 (HF): https://huggingface.co/spaces/Qwen/Qwen-Image-Layered 🚀 在线体验 (ModelScope): https://modelscope.cn/studios/Qwen/Qwen-Image-Layered
模型效果展示:复杂场景的智能分层
分层细节对比:原图与分离出的独立图层
提示词控制示例:通过文字指导分层结构
用途是什么?
图像智能分层对设计师而言,简直是一个“神器”!以下是社区网友发掘的几个高光应用场景。
1. 拆解PPT/演示文稿图片
将AI生成的一整页幻灯片内容图,智能拆解成独立的图片、文字、图形元素,便于在PPT中直接编辑和调整布局。
Quentin Lhoest 🤗 @lhoestq · 12月20日 来得正是时候!开源将修复Google Slide AI Klaas @forgebitz
在谷歌幻灯片里用AI 生成了一页幻灯片 结果它是一张幻灯片“图片”
示意图:将单张幻灯片图像分解为可编辑元素
2. 游戏开发,快速分离场景元素
轻松分离游戏场景原画中的背景、角色、前景物体、UI文字等,极大加速游戏素材的制作与迭代流程。
@nicekate8888 Qwen-Image-Layered 背景分离、文字分离,效果太强了。好适合游戏开发!
![]()
游戏场景图分层示例:分离背景、角色、特效等
3. 革命性的设计图层管理与编辑
从根本上改变了“后编辑”AI图像的逻辑,让精准、局部的调整成为可能,而无需担心破坏整体。
** Maki@Sunwood AI Labs. @hAru_mAki_ch** <<Qwen-Image-Layered爆誕>>> 这个一定要试试!!! 🎨 将一张图像分解为多个“图层”的革新性AI 🎨 画完后也能自由自在地操作部件 🎨 直观而简单的图像编辑新世界
【AI图像编辑的重大烦恼】 ⚠️ 想修改的部分之外也会发生微妙变化 ⚠️ 背景或无关部分会崩坏的现状 ⚠️ 无法100%反映用户意图的课题
【为何会产生问题?】 🖼️ 传统的数字图像是“一张画布” 🖼️ 全要素融合的“栅格图像”性质 🖼️ 像素之间紧密结合的缘故
传统编辑 vs 分层编辑对比示意图
1LittleCoder💻 @1littlecoder . @Alibaba_Qwen 这次真的玩大了 🔥 多层分解来了! 这完全是AI驱动的Photoshop! QwenImage-Layered是一个端到端的扩散模型,可将单个RGB图像分解为多个语义解耦的RGBA图层。 这意味着,你可以进行针对性编辑,精度更高,且不会干扰其他图层/组件!
精准编辑示例:只修改特定图层(如衣服颜色)
Xavier Mitjana @xavier_mitjana 最后我还是没忍住。 我用最新的Qwen Layered Image模型创建了我的迷你AI Photoshop。 一切简单快速,多亏了Opus 4.5通过 @fal 的API连接模型。
网友自制的AI Photoshop界面演示
如何使用?
除了上文官方提到的使用地址,还有以下地方可以用:
在ComfyUI中使用
该模型已支持ComfyUI工作流。在ComfyUI中运行可以方便地调整尺寸等参数。需要注意的是,直接输出大尺寸(如1152x2016)未量化模型的结果,即使在RTX5090上也可能需要较长时间(约500秒),但相应的,输出质量会非常高。
ComfyUI工作流节点图
在ComfyUI中处理并查看分层结果
在Figma中使用(通过插件)
可以使用作者开发的Figma插件:ComfyUi Image Generator Cloud。该插件最新版本已接入Google的Nano Banana Pro以及这个Qwen-Image-Layered模型。
Figma插件界面截图
直接在Figma中选中想要分层的图片,设置好参数(如图层数量),稍等片刻即可将分好层的图片组导入Figma。
在Figma中调用插件进行分层
分层完成后,稍作处理就能快速制作成海报。下图示例中,只是简单添加了文字并调整了图层样式。
利用分层结果快速合成的海报
局限性
目前模型并非完美,社区用户也指出了其现阶段的一些局限。
Amogh Vaishampayan @amogh42 我对 @Alibaba_Qwen 的Qwen-Image-Layered模型的分析——对于平面设计类图像效果不错,但对于照片(写实图像)就不那么理想了!
主要问题在于提取出一个图层后,填补留下的“空洞”。我预计他们或其他人会对此进行改进,因为现在的修复(Inpainting)模型已经相当好了。
在ComfyUI中使用它,并利用提取的图层作为蒙版进行重新绘制,会得到好得多的结果。
![]()
局限性示例:处理写实照片时,背景填补可能不自然
简而言之,该模型在卡通、插画、设计稿等语义和结构清晰的图像上表现优异,但在处理复杂纹理、光影交错的真实照片时,背景修复能力尚有提升空间。结合现有的图像修复模型进行后期处理,是当前获得更佳效果的有效策略。
写在最后
Qwen-Image-Layered的发布,标志着AI向理解图像内部结构迈出了关键一步。它不再将图像视为一个不可分割的整体,而是能够解析其内在的层次与语义。对于设计师来说,这意味着一扇新的大门已经打开:更流畅的AI协作流程、更精准的创意修改、以及从“生成后即固定”到“生成后仍可深度编辑”的范式转变。尽管仍有改进空间,但其开源特性无疑将加速整个生态的进化。不妨现在就尝试一下,亲自感受它将为你的设计工具箱带来的全新可能。
更多 AI 前沿技术与设计灵感,欢迎关注「设计小站」公众号(ID:sjxz00),一起探索科技与设计的融合创新。
示意图:将单张幻灯片图像分解为可编辑元素
游戏场景图分层示例:分离背景、角色、特效等
传统编辑 vs 分层编辑对比示意图
精准编辑示例:只修改特定图层(如衣服颜色)
网友自制的AI Photoshop界面演示
局限性示例:处理写实照片时,背景填补可能不自然