高级图像生成
本指南假设您已经了解图像生成的基础知识。基础指南中的信息不会再次解释。
我们的网站使用SDXL(Stable Diffusion eXtra Large)作为基础。为了用户舒适,权重已被简化,语法大部分已被禁用。
本指南涵盖:高级设置(LoRA、调度器、提示词强度、CLIP跳过)、权重、风格化、预设和修复。
高级设置
层
层是构成图像模型的"块"。将Stable Diffusion想象成一座由楼层组成的塔 - 每个"块"都有自己的工作:
- 早期层 - 捕获低级细节(边缘、颜色、纹理)
- 中间层 - 捕获图案和形状(面部、服装、身体结构)
- 后期层 - 捕获语义含义(如"猫"与"狗"或"动漫风格"与"照片"的概念)
LoRA
LoRA是用于微调大型模型的训练方法。当您有图像模型时,LoRA通过将自己注入某些层来教它新技巧 - 就像重塑塔中的特定楼层。
CLIP跳过层
Stable Diffusion使用CLIP(对比语言-图像预训练)作为文本编码器,将您的提示词转换为嵌入。CLIP基本上是您和图像模型之间的翻译器。跳过层会切断更高级别的理解。
许多动漫模型和LoRA在训练时考虑了CLIP跳过值(最常见的是2)。跳过一层可能会给您更像动漫或风格化的结果。
调度器
调度器控制生成过程中的去噪过程。它强烈影响图像的清晰度、连贯性和提示词遵循度。
Euler a - 快速
- 产生清晰、细节丰富、对比度强的图像
- 非常适合动漫、风格化艺术或素描般的细节
- 有时在写实方面不稳定 - 可能会扭曲精细纹理或面部
- 何时使用: 快速、创意、详细的动漫风格或概念艺术输出
DPM++ SDE Karras
- 产生平滑、高质量的渐变和柔和的过渡
- 非常适合较小的细节
- 每次渲染都会有所不同 - 适合有机变化
- 何时使用: 照片级真实渲染、自然光照、绘画风格、柔和过渡
DPM++ 2M - 确定性
- 产生平滑、一致的结果,具有高提示词保真度
- 速度和准确性之间的良好平衡
- 何时使用: 写实主义、肖像、稳定性重要的一致风格
DPM++ 2M Karras
- 产生比普通DPM++ 2M更平滑的渐变、更好的纹理和更高的细节保真度
- 比Euler A稍慢,但写实质量更高
- 何时使用: 照片级真实图像、肖像、复杂纹理 - 最适合精致、稳定的外观
提示词强度
提示词强度改变CFG比例 - 值越高,系统越遵循您的图像提示词。
- 低CFG (1-5): 模型较少关注提示词。更多艺术自由,更梦幻的构图。风险:图像偏离您的要求。
- 中等CFG (6-9): 遵循度与创造力之间的平衡。常见最佳值:7-8。保持准确性和美观性。
- 高CFG (10+): 强烈遵循关键词。可能变得过饱和、刺眼或"烧焦"。风险:奇怪的伪影、僵硬或不自然的图像。
权重
+的实际权重是1.1^x(其中x = +的数量)。而-是0.9^x。
| 符号数量 | -的权重 | +的权重 |
|---|---|---|
| 1 | 0.9 | 1.1 |
| 2 | 0.81 | 1.21 |
| 3 | 0.729 | 1.331 |
| 4 | 0.6561 | 1.4641 |
| 5 | 0.59049 | 1.61051 |
| 6 | 0.531441 | 1.771561 |
免责声明:此表不是数学表!它是最终结果的视觉表示!
您可以利用系统:(keyword-)2等同于(keyword)1.8。更复杂的:(keyword---)2计算为(keyword 0.9^3)2 = 0.729 * 2 = (keyword)1.458
风格化
关键词和权重的组合可以实现某些所需的外观。使用painterly_shading的示例:
| 使用Painterly_shading+++ | 不使用 |
|---|---|
![]() | ![]() |
您可以改变:
- 风格/风格化 - 整体外观
- 阴影/光照 - 体积和深度
- 线稿 - 边缘的定义
- 比例 - 主题的描绘方式
- 纹理/细节 - 表面细节
- 构图/取景 - 排列
- 模拟 - 图片模拟的媒介
- 质量 - 整体质量
预设和物理
图像提示词只有550个字符!您可以通过使用背景、服装预设和物理属性来获得更风格化的提示词,从而规避此限制。
Soulkyn上的预设规则:32个字符,18个标签。
技巧:
- 使用分号
;将多个含义打包到一个标签中 - 使用下划线
_为AI精确定位含义 - 使用
:2应用更强的权重(已归一化以防止爆炸)
示例:PaintFuka角色
物理标签: Painterly; Soft; No_lineart, 8K;16K; Hdr, Blue Lips, Slim Eyebrows; Fair_skin:2, Long Two-Toned Dark_blue Hair, Realistic_character_anatomy, High Quality, Highest_quality; Extremely_detailed, Adult_woman:2; Mature_woman:2, Realistic Details, Painterly Texture, Cute;Kawaii, Digital_painting:2, Thick Thighs; Slim Waist, High Contrast, Painterly Details, Long Blue Hair; Blue Eyes, Dramatic; Epic; Emotional
服装标签: Hyperdetailed_eyelashes, High_contrast:2; Shadows:2; Light:2, Realistic:2; Anime:2, Canvas_tone_texture; Hyperdetailed, Hyperdetailed_skin:2, Expressive;Hyperrealistic:2, Hyperdetailed_body:2; Cute:2, Glow_diffusion; Saturated_colors:2, Hyperdetailed_shading, Hyperdetailed_textures:2, Hyperdetailed_hair, Glowing_eyes:2; Big_eyes:2, Hyperdetailed_clothing:2, Hyperdetailed_eyes:2, Art Bloom; Soft; Hard; Hairstrands, Painterly_skin_softness; Kawaii:2;, Soft Light; Thick Thighs; Matte_skin:2, Realistic Anime; Soft Shading
背景: Glowing Highlights, Detailed Rendering, Vibrant Colors, Saturated Colors, Ambient Lighting, Anime Art Style, Cell Shading, Rim Lighting, Digital Painting, Semi-Realistic, Soft Shading, Smooth Gradients, Dramatic Lighting, Polished Finish, Professional Artwork, Clean Lineart, High Contrast, Artstation Quality; Highest Quality
分解部分物理属性:
- Painterly - 更多绘画细节
- Soft - 更柔和的图片
- No_lineart - 无线稿(类似负面标签)
- 8k; 16k / High Quality - 期望非常高的质量
- Hdr - 光影之间更深的对比度
- Blue lips - 角色有蓝色嘴唇
- Fair_skin:2 - 真的想要白皙的皮肤
- Long Two-Toned Dark_blue Hair - 有两种深蓝色调的长发
- Realistic_character_anatomy - 真实的解剖结构
高级提示的结构
是时候运用我们所有的新知识来更有创意地制作提示词了!为此,我们将使用PaintFuka的背景和服装。
这是未风格化提示词和风格化提示词之间的比较:
| 未风格化 | 风格化 |
|---|---|
![]() | ![]() |
首先让我们描述一下我们想要创建的图片:
- 人数:1
- 视角:牛仔镜头(膝盖以上视角)
- 角色穿着白色夏季连衣裙
- 角色在跑步时伸出一只手
- 表情:微笑
- 背景:不重要,可以模糊以突出角色
- 质量:极其详细的真实插图
考虑到这个列表,让我们准备所有的LoRA、调度器和关键词。
因为我们希望图片类似于详细的真实插图,所以让我们使用专门用于此目的的LoRA!
这是应用微观/精细细节:6和真实插图:6 LoRA的结果:
| 使用LoRA | 不使用LoRA |
|---|---|
![]() | ![]() |
现在让我们给她穿上衣服并让她跑起来!
最终提示词:
高级设置:
- LoRA: Micro / Fine details :6, Realistic Illustration :6
- 提示词强度: 11.0
- CLIP跳过: 2
- 调度器: DPM++ 2M
- 图像方向: 横向
- 种子: 随机
- 提示: Portrait
- 背景: PaintFuka
- 服装: PaintFuka
- 图像提示词:
(solo, alone)+++, (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++, (close, cowboy_shot)++++, (white_summer_dress---)2, (running)+++, (reaching_out, one_hand, outstretched_hand)+++, (smiling, Happy, open_mouth, closed_eyes)+, (blurry_background--)2
最终结果:
现在让我们分析提示词中包含的内容以及它是如何工作的:
(solo, alone)+++- 使角色独自出现在图片中(macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++- 这些告诉AI我们想要获得的图片质量(close, cowboy_shot)++++- 这告诉AI我们想要一个非常近的牛仔镜头(white_summer_dress---)2- 这强制AI给我们的角色穿上白色夏季连衣裙(running)+++- 这告诉AI我们想要角色在跑步(reaching_out, one_hand, outstretched_hand)+++- 这精确地告诉AI我们想要什么样的姿势(smiling, Happy, open_mouth, closed_eyes)+- 这定义了我们角色的表情(blurry_background--)2- 这强制AI给我们一个模糊的背景
作为额外内容,这是仅添加一个LoRA的效果:
常见问题
最常见的问题是质量下降 - 一些用户称之为"地毯化",因为损坏的图像看起来像地毯表面的特写。
这很可能是由于:
- 权重过多
- LoRA强度过大
- 标签冲突
修复
我们的网站提供AI辅助图像编辑。这是一个实验性功能,由于资源消耗而需要花费灵魂。
要编辑图像:
- 前往角色的图库
- 选择要编辑的图像
- 按编辑图像按钮
与图像生成不同,修复使用描述性提示词。用可理解的句子向AI解释您想要什么。
示例: "将角色的头发变为白色,皮肤变为黑色"
结果:


