高级图像生成

本指南假设您已经了解图像生成的基础知识。基础指南中的信息不会再次解释。

我们的网站使用SDXL(Stable Diffusion eXtra Large)作为基础。为了用户舒适,权重已被简化,语法大部分已被禁用。

本指南涵盖:高级设置(LoRA、调度器、提示词强度、CLIP跳过)、权重、风格化、预设和修复。

高级设置

层

层是构成图像模型的"块"。将Stable Diffusion想象成一座由楼层组成的塔 - 每个"块"都有自己的工作:

早期层 - 捕获低级细节(边缘、颜色、纹理)
中间层 - 捕获图案和形状(面部、服装、身体结构)
后期层 - 捕获语义含义(如"猫"与"狗"或"动漫风格"与"照片"的概念)

LoRA

LoRA是用于微调大型模型的训练方法。当您有图像模型时,LoRA通过将自己注入某些层来教它新技巧 - 就像重塑塔中的特定楼层。

CLIP跳过层

Stable Diffusion使用CLIP(对比语言-图像预训练)作为文本编码器,将您的提示词转换为嵌入。CLIP基本上是您和图像模型之间的翻译器。跳过层会切断更高级别的理解。

许多动漫模型和LoRA在训练时考虑了CLIP跳过值(最常见的是2)。跳过一层可能会给您更像动漫或风格化的结果。

调度器

调度器控制生成过程中的去噪过程。它强烈影响图像的清晰度、连贯性和提示词遵循度。

Euler a - 快速

产生清晰、细节丰富、对比度强的图像
非常适合动漫、风格化艺术或素描般的细节
有时在写实方面不稳定 - 可能会扭曲精细纹理或面部
何时使用: 快速、创意、详细的动漫风格或概念艺术输出

DPM++ SDE Karras

产生平滑、高质量的渐变和柔和的过渡
非常适合较小的细节
每次渲染都会有所不同 - 适合有机变化
何时使用: 照片级真实渲染、自然光照、绘画风格、柔和过渡

DPM++ 2M - 确定性

产生平滑、一致的结果,具有高提示词保真度
速度和准确性之间的良好平衡
何时使用: 写实主义、肖像、稳定性重要的一致风格

DPM++ 2M Karras

产生比普通DPM++ 2M更平滑的渐变、更好的纹理和更高的细节保真度
比Euler A稍慢,但写实质量更高
何时使用: 照片级真实图像、肖像、复杂纹理 - 最适合精致、稳定的外观

提示词强度

提示词强度改变CFG比例 - 值越高,系统越遵循您的图像提示词。

低CFG (1-5): 模型较少关注提示词。更多艺术自由,更梦幻的构图。风险:图像偏离您的要求。
中等CFG (6-9): 遵循度与创造力之间的平衡。常见最佳值:7-8。保持准确性和美观性。
高CFG (10+): 强烈遵循关键词。可能变得过饱和、刺眼或"烧焦"。风险:奇怪的伪影、僵硬或不自然的图像。

权重

+的实际权重是1.1^x(其中x = +的数量)。而-是0.9^x。

符号数量	-的权重	+的权重
1	0.9	1.1
2	0.81	1.21
3	0.729	1.331
4	0.6561	1.4641
5	0.59049	1.61051
6	0.531441	1.771561

免责声明:此表不是数学表!它是最终结果的视觉表示!

您可以利用系统:(keyword-)2等同于(keyword)1.8。更复杂的:(keyword---)2计算为(keyword 0.9^3)2 = 0.729 * 2 = (keyword)1.458

风格化

关键词和权重的组合可以实现某些所需的外观。使用painterly_shading的示例:

使用Painterly_shading+++	不使用

您可以改变:

风格/风格化 - 整体外观
阴影/光照 - 体积和深度
线稿 - 边缘的定义
比例 - 主题的描绘方式
纹理/细节 - 表面细节
构图/取景 - 排列
模拟 - 图片模拟的媒介
质量 - 整体质量

预设和物理

图像提示词只有550个字符!您可以通过使用背景、服装预设和物理属性来获得更风格化的提示词,从而规避此限制。

Soulkyn上的预设规则:32个字符,18个标签。

技巧:

使用分号;将多个含义打包到一个标签中
使用下划线_为AI精确定位含义
使用:2应用更强的权重(已归一化以防止爆炸)

示例:PaintFuka角色

物理标签: Painterly; Soft; No_lineart, 8K;16K; Hdr, Blue Lips, Slim Eyebrows; Fair_skin:2, Long Two-Toned Dark_blue Hair, Realistic_character_anatomy, High Quality, Highest_quality; Extremely_detailed, Adult_woman:2; Mature_woman:2, Realistic Details, Painterly Texture, Cute;Kawaii, Digital_painting:2, Thick Thighs; Slim Waist, High Contrast, Painterly Details, Long Blue Hair; Blue Eyes, Dramatic; Epic; Emotional

服装标签: Hyperdetailed_eyelashes, High_contrast:2; Shadows:2; Light:2, Realistic:2; Anime:2, Canvas_tone_texture; Hyperdetailed, Hyperdetailed_skin:2, Expressive;Hyperrealistic:2, Hyperdetailed_body:2; Cute:2, Glow_diffusion; Saturated_colors:2, Hyperdetailed_shading, Hyperdetailed_textures:2, Hyperdetailed_hair, Glowing_eyes:2; Big_eyes:2, Hyperdetailed_clothing:2, Hyperdetailed_eyes:2, Art Bloom; Soft; Hard; Hairstrands, Painterly_skin_softness; Kawaii:2;, Soft Light; Thick Thighs; Matte_skin:2, Realistic Anime; Soft Shading

背景: Glowing Highlights, Detailed Rendering, Vibrant Colors, Saturated Colors, Ambient Lighting, Anime Art Style, Cell Shading, Rim Lighting, Digital Painting, Semi-Realistic, Soft Shading, Smooth Gradients, Dramatic Lighting, Polished Finish, Professional Artwork, Clean Lineart, High Contrast, Artstation Quality; Highest Quality

分解部分物理属性:

Painterly - 更多绘画细节
Soft - 更柔和的图片
No_lineart - 无线稿(类似负面标签)
8k; 16k / High Quality - 期望非常高的质量
Hdr - 光影之间更深的对比度
Blue lips - 角色有蓝色嘴唇
Fair_skin:2 - 真的想要白皙的皮肤
Long Two-Toned Dark_blue Hair - 有两种深蓝色调的长发
Realistic_character_anatomy - 真实的解剖结构

高级提示的结构

是时候运用我们所有的新知识来更有创意地制作提示词了!为此,我们将使用PaintFuka的背景和服装。

这是未风格化提示词和风格化提示词之间的比较:

未风格化	风格化

首先让我们描述一下我们想要创建的图片:

人数:1
视角:牛仔镜头(膝盖以上视角)
角色穿着白色夏季连衣裙
角色在跑步时伸出一只手
表情:微笑
背景:不重要,可以模糊以突出角色
质量:极其详细的真实插图

考虑到这个列表,让我们准备所有的LoRA、调度器和关键词。

因为我们希望图片类似于详细的真实插图,所以让我们使用专门用于此目的的LoRA!

这是应用微观/精细细节:6和真实插图:6 LoRA的结果:

使用LoRA	不使用LoRA

现在让我们给她穿上衣服并让她跑起来!

最终提示词:

高级设置:

LoRA: Micro / Fine details :6, Realistic Illustration :6
提示词强度: 11.0
CLIP跳过: 2
调度器: DPM++ 2M
图像方向: 横向
种子: 随机
提示: Portrait
背景: PaintFuka
服装: PaintFuka
图像提示词: (solo, alone)+++, (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++, (close, cowboy_shot)++++, (white_summer_dress---)2, (running)+++, (reaching_out, one_hand, outstretched_hand)+++, (smiling, Happy, open_mouth, closed_eyes)+, (blurry_background--)2

最终结果:

现在让我们分析提示词中包含的内容以及它是如何工作的:

(solo, alone)+++ - 使角色独自出现在图片中
(macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++ - 这些告诉AI我们想要获得的图片质量
(close, cowboy_shot)++++ - 这告诉AI我们想要一个非常近的牛仔镜头
(white_summer_dress---)2 - 这强制AI给我们的角色穿上白色夏季连衣裙
(running)+++ - 这告诉AI我们想要角色在跑步
(reaching_out, one_hand, outstretched_hand)+++ - 这精确地告诉AI我们想要什么样的姿势
(smiling, Happy, open_mouth, closed_eyes)+ - 这定义了我们角色的表情
(blurry_background--)2 - 这强制AI给我们一个模糊的背景

作为额外内容,这是仅添加一个LoRA的效果:

常见问题

最常见的问题是质量下降 - 一些用户称之为"地毯化",因为损坏的图像看起来像地毯表面的特写。

这很可能是由于:

权重过多
LoRA强度过大
标签冲突

修复

我们的网站提供AI辅助图像编辑。这是一个实验性功能,由于资源消耗而需要花费灵魂。

要编辑图像:

前往角色的图库
选择要编辑的图像
按编辑图像按钮

与图像生成不同,修复使用描述性提示词。用可理解的句子向AI解释您想要什么。

示例: "将角色的头发变为白色,皮肤变为黑色"

结果:

高级图像生成

高级设置 复制链接

层

LoRA

CLIP跳过层

调度器

Euler a - 快速

DPM++ SDE Karras

DPM++ 2M - 确定性

DPM++ 2M Karras

提示词强度

权重 复制链接

风格化 复制链接

预设和物理 复制链接

示例:PaintFuka角色

高级提示的结构 复制链接

最终提示词:

常见问题 复制链接

修复 复制链接

高级设置

权重

风格化

预设和物理

高级提示的结构

常见问题

修复