一篇文章让你明白什么是SD绘画(Stable Diffusion) - Stable Diffusion教程

首页 / 行业资讯 / Stable Diffusion教程

当你第一次打开stable diffusion的时候，可能会感觉它的界面复杂且难以理解，因为它涉及到很多功能和参数，可能不知道该从哪里下手。为了帮助你轻松上手，让AI创作变得简单而有趣，我将介绍一些基本原理和操作步骤。

在stable diffusion中，有两个关键的空间概念，即像素空间和前空间。像素空间是我们在现实世界中可以看到的，而前空间是我们看不见的低维度空间。stable diffusion就是在前空间中进行扩散和降噪，生成图像，然后再转到像素空间，我们就可以在现实中看到这个图像了。

首先，在提示词框里输入文字，通过clip编码后，将其转化为stable diffusion可以理解的数据，并传入到前空间。在前空间中，会生成一个随机的噪声图片，然后通过大模型进行干预，接着采样器开始降噪。经过几十次的迭代后，我们想要的图像就在前空间中形成，最后通过VE解码到像素空间。

如果你想生成一张图像，可以以一个女孩为提示词。首先，将提示词送入颗粒的编码器，经过神经网络多层处理后，再传送到前空间。在这个过程中，可以选择中指乘2来表示传递到最深层，即最精确的层。根据使用的大模型不同，生成的结果也会有所不同。通过比较，可以发现中指层的数值越大，生成的内容与提示词相关性就越低。通常会选择数值为2的中指层，因为这样可以得到更符合我们想要的结果。

接下来是选择采样器。不同的采样器会产生不同的结果，具体的说明会在后面的视频中详细介绍。可以选择默认的采样器进行试验。然后设置迭代步数，即生成图像的过程中模型重复执行采样的次数。步数越多，生成的图像质量就会越高，但生成的速度也会变慢。实验表明，超过一定的步数后，质量不会有明显的提高，只有细节上会有轻微的变化。根据需求适当选择步数。

在设置图像尺寸时，宽度和高度可以根据需要进行调整。尺寸越大，图像的质量和细节就会越好，但对电脑的性能要求也会更高。需要注意的是，由于使用的是SD1.5版本的模型，它是用512乘以512的图片进行训练的，尺寸过大可能会导致异常现象。在这里选择512乘以512作为尺寸。

在批次设置中，可以选择一次生成几张图像。默认设置是一次生成一张，如果想一次生成多张，可以调整总批次数和单批次数。总批次数表示生成图像的批次数，单批次数表示每批生成图像的数量。可以根据需要进行设置，分批生成的方式可以保证已经生成的图像不会丢失。

下面是提示词引导系数，可以理解为提示词的权重。系数越大，生成的图像就会越接近你的提示词，系数越小，AI的创作自由度就会越大，生成的图像也可能偏离你的提示词。较小的系数给了模型更多的发挥空间，有时候较小的系数会比较大的引导系数生成更好的结果。但系数过大也会得到不理想的效果，需要在保证图片质量的前提下找到一个平衡点。

随机数种子可以看作是前空间中的随机噪声，图像默认值-1代表生成图像是随机的。每次生成图像后，这些随机的种子都会被记录下来，我们可以固定这张图片的种子值，从而重现之前生成过的图像。这里可以选择随机。

最后是VE解码阶段，在这里可以选择外挂VE模型进行修正。外挂VE模型是在浅空间生成图片之后进行修正，可以调整颜色、明暗等细节，以获得更好的效果。通常可以将其看作是滤镜来使用。

完成以上设置后，点击生成即可得到一张AI生成的作品。如果想保存这张图片，可以在文件夹中找到它，然后点击打开。通过stable diffusion生成的图像都会存放在这个文件夹中。

如果想要尝试生成其他风格的图像，需要下载对应的checkpoint模型，并将其放入stable diffusion的模型目录中。安装好模型后，刷新界面，就可以在下拉菜单中选择所安装的模型，并生成对应风格的图像。

分享到：微信 QQ好友新浪微博 QQ空间腾讯微博人人网