一篇文章让你明白什么是SD绘画(Stable Diffusion)

2024-04-25 21:36:33| 发布者:小编 | 查看: 94

当你第一次打开stable diffusion的时候,可能会感觉它的界面复杂且难以理解,因为它涉及到很多功能和参数,可能不知道该从哪里下手。为了帮助你轻松上手,让AI创作变得简单而有趣,我将介绍一些基本原理和操作步骤。

1714052382447.png

在stable diffusion中,有两个关键的空间概念,即像素空间和前空间。像素空间是我们在现实世界中可以看到的,而前空间是我们看不见的低维度空间。stable diffusion就是在前空间中进行扩散和降噪,生成图像,然后再转到像素空间,我们就可以在现实中看到这个图像了。

1714052701765.png

1714052762776.png1714052814450.png

首先,在提示词框里输入文字,通过clip编码后,将其转化为stable diffusion可以理解的数据,并传入到前空间。在前空间中,会生成一个随机的噪声图片,然后通过大模型进行干预,接着采样器开始降噪。经过几十次的迭代后,我们想要的图像就在前空间中形成,最后通过VE解码到像素空间。1714052858212.png

如果你想生成一张图像,可以以一个女孩为提示词。首先,将提示词送入颗粒的编码器,经过神经网络多层处理后,再传送到前空间。在这个过程中,可以选择中指乘2来表示传递到最深层,即最精确的层。根据使用的大模型不同,生成的结果也会有所不同。通过比较,可以发现中指层的数值越大,生成的内容与提示词相关性就越低。通常会选择数值为2的中指层,因为这样可以得到更符合我们想要的结果。

接下来是选择采样器。不同的采样器会产生不同的结果,具体的说明会在后面的视频中详细介绍。可以选择默认的采样器进行试验。然后设置迭代步数,即生成图像的过程中模型重复执行采样的次数。步数越多,生成的图像质量就会越高,但生成的速度也会变慢。实验表明,超过一定的步数后,质量不会有明显的提高,只有细节上会有轻微的变化。根据需求适当选择步数。

1714053020355.png

1714053060074.png

在设置图像尺寸时,宽度和高度可以根据需要进行调整。尺寸越大,图像的质量和细节就会越好,但对电脑的性能要求也会更高。需要注意的是,由于使用的是SD1.5版本的模型,它是用512乘以512的图片进行训练的,尺寸过大可能会导致异常现象。在这里选择512乘以512作为尺寸。

1714053079783.png

在批次设置中,可以选择一次生成几张图像。默认设置是一次生成一张,如果想一次生成多张,可以调整总批次数和单批次数。总批次数表示生成图像的批次数,单批次数表示每批生成图像的数量。可以根据需要进行设置,分批生成的方式可以保证已经生成的图像不会丢失。

1714053134890.png

下面是提示词引导系数,可以理解为提示词的权重。系数越大,生成的图像就会越接近你的提示词,系数越小,AI的创作自由度就会越大,生成的图像也可能偏离你的提示词。较小的系数给了模型更多的发挥空间,有时候较小的系数会比较大的引导系数生成更好的结果。但系数过大也会得到不理想的效果,需要在保证图片质量的前提下找到一个平衡点。

1714052966156.png

随机数种子可以看作是前空间中的随机噪声,图像默认值-1代表生成图像是随机的。每次生成图像后,这些随机的种子都会被记录下来,我们可以固定这张图片的种子值,从而重现之前生成过的图像。这里可以选择随机。

1714053272347.png

最后是VE解码阶段,在这里可以选择外挂VE模型进行修正。外挂VE模型是在浅空间生成图片之后进行修正,可以调整颜色、明暗等细节,以获得更好的效果。通常可以将其看作是滤镜来使用。


完成以上设置后,点击生成即可得到一张AI生成的作品。如果想保存这张图片,可以在文件夹中找到它,然后点击打开。通过stable diffusion生成的图像都会存放在这个文件夹中。

如果想要尝试生成其他风格的图像,需要下载对应的checkpoint模型,并将其放入stable diffusion的模型目录中。安装好模型后,刷新界面,就可以在下拉菜单中选择所安装的模型,并生成对应风格的图像。


<
>
QQ在线咨询
售前咨询热线
400-9999-531
售后服务热线
13831235958
返回顶部