5 min read
视频素材自由了?AI一键音视频工作流

前言
大家应该都知道,前天,6月5日,赛博佛祖stability.ai把音频模型Stable Audio Open开源了。
Stable Audio Open 允许任何人通过简单的文本提示生成长达 47 秒的高质量音频数据。经过专业训练后,它非常适合创建鼓点、乐器重复乐段、环境音、拟音录音和其他用于音乐制作和声音设计的音频样本。
那么还没部署好的朋友,估计没有意识到这个模型的强大,这么说吧,之前应该有了结果SUNO吧?通过自然语言,就可以生成各种风格的音乐或者音效,Stable Audio Open也有同样的功效!
而我关注的是,能不能通过连接SVD还有Stable Audio Open,做一个音视频素材的工作流?答案是肯定的!而且,通过接入语言大模型,只需要我一句话就可以一起生成音视频并合成,风格很搭哦~🤣
先看看效果
以下效果未经剪辑,大家看看,标题就是我输出的提示语。
大海的黄昏
种子力量
亚特兰提斯
梵高的午夜咖啡厅
破茧成蝶
深邃星空
星际穿越
可爱小猫
圣诞节女孩
雨后街道
森林夏雨
盛开的玫瑰
沙尘暴
雪花
是不是音视频的调性都搭配上了?实话说,还是挺符合我的预期的。
工作流
这个工作流其实很简单,大脑是使用语言大模型节点,使用了我自己做的语言大模型节点,接收我的提示语,分别生成文生图提示语和音乐提示语,然后图片输入到SVD生成视频,最后通过合并音频的方式一起输出视频。
大语言处理
提示语:
# 任务
## 任务1:
作为提示生成器,我会给你一段文字,然后你详细描述与该文字匹配的图像,只能用一个回答。如果我用中文和你交流,请务必用英语回复。
## 任务2
同样根据我的上面的一段文字,描述一个音乐风格,需要匹配“任务1”生成的图像。
# 输出
最后输出两段文字:
<图像描述语>
:
<音乐描述语>
注意两段描述语用英文冒号“ : ” 隔开
# 示例
## 我的输入
希望
## 你的输出
A child standing in a field of sunflowers, looking up at the sky with outstretched arms. The sun is shining brightly, casting a warm glow over the scene. The sky is clear with just a few fluffy white clouds, and the sunflowers are tall and vibrant, reaching towards the sunlight. The child has a look of pure joy and wonder, symbolizing hope and endless possibilities. Butterflies can be seen fluttering around, adding to the sense of serenity and natural beauty. The entire scene conveys a strong sense of optimism and hope for the future.
:
Cheerful, uplifting acoustic folk music characterized by gentle guitar strumming, the bright sounds of a mandolin, and a light, breezy melody. The rhythm is steady and upbeat, fostering a sense of positivity and warmth. Occasional harmonica or violin accents add to the rustic, hopeful atmosphere. The overall sound is simple yet heartwarming, evoking the feeling of a sunny, hopeful day in nature.
分割提示语
生成图片
生成音频
生成视频
SVD生成视频
合成输出
通过VHS音视频合并节点,合并输出。
这个工作流值得大家一试试,挺好玩的!
关注我公众号(设计小站):sjxz00,获取更多AI辅助设计和设计灵感趋势。