WithAI.Design

5 min read

ComfyUI一键生成有意境的书摘

ComfyUI一键生成有意境的书摘

前言

最近在读一些经典,如《金刚金》、《道德经》之类的,有所感悟,总想记录下来,但是呢,又不想那么平平无奇😂,所以想着用图文的方式记录下来。所以就研究了一套 ComfyUI 自动生成有意境的书摘。 然而,通过 AI 写中文字,那是非常的难的事,即使如混元、字节的 colors,也只能写特定的大字,对于书本段落,那是完全不可用🥱。 所以我研究了一个工作流,大家不妨看看。

先看效果

使用场景

  1. 日常的记录。当然这个成本就高了点,后续我看看能不能结合 memos 等开源工具调用 dify 进行工作流一键生成。
  2. 自媒体。用于小红书、小绿书等书摘生成。

工作流

当然,目前还没有做到完全的自动化,输入的方面还是用 Figma 或者 ps 制作一个简单的输入图。

输入图

我用 Figma 简单排了一下版。

因为需要检测蒙板,所以使用 RGB 分离颜色。

处理遮罩

这里主要是通过 RGB 通道,分离各个遮罩。 其中绿色的输入后面的重绘 fill,蓝色字体部分,是作为后面拼合图片用,精准还原文字。 整体是作为 canny 控制,精准生成大致的图像。

提示语处理

使用 llm 精准处理画面,包括对画面中的文字区域的控制。得益于 flux 的优秀提示语引导的,几乎是还原了提示词的意思。

元素做了一些拆分。

第一次采样

标准的 flux canny 流程,canny 强度要测试。

Flux fill 重绘

根据上面的生成的蒙板,重绘文字区。

这样就生成了一张“白纸”。

拼合图像

然后把文字拼合会白纸上。

怎么样?是不是很简单? 后面我考虑让自动化更高点,把文字生成也放在工作流中。

红包封面时间

关注我公众号(设计小站):sjxz 00,获取更多 AI 辅助设计和设计灵感趋势。

标签