Soulkyn AI标志

高级图像生成

本指南假设您已经了解图像生成的基础知识。基础指南中的信息不会再次解释。

我们的网站使用SDXL(Stable Diffusion eXtra Large)作为基础。为了用户舒适,权重已被简化,语法大部分已被禁用。

本指南涵盖:高级设置(LoRA、调度器、提示词强度、CLIP跳过)、权重、风格化、预设和修复。

高级设置

Advanced settings panel

层是构成图像模型的"块"。将Stable Diffusion想象成一座由楼层组成的塔 - 每个"块"都有自己的工作:

  • 早期层 - 捕获低级细节(边缘、颜色、纹理)
  • 中间层 - 捕获图案和形状(面部、服装、身体结构)
  • 后期层 - 捕获语义含义(如"猫"与"狗"或"动漫风格"与"照片"的概念)

LoRA

LoRA是用于微调大型模型的训练方法。当您有图像模型时,LoRA通过将自己注入某些层来教它新技巧 - 就像重塑塔中的特定楼层。

CLIP跳过层

Stable Diffusion使用CLIP(对比语言-图像预训练)作为文本编码器,将您的提示词转换为嵌入。CLIP基本上是您和图像模型之间的翻译器。跳过层会切断更高级别的理解。

许多动漫模型和LoRA在训练时考虑了CLIP跳过值(最常见的是2)。跳过一层可能会给您更像动漫或风格化的结果。

调度器

调度器控制生成过程中的去噪过程。它强烈影响图像的清晰度、连贯性和提示词遵循度。

Euler a - 快速

  • 产生清晰、细节丰富、对比度强的图像
  • 非常适合动漫、风格化艺术或素描般的细节
  • 有时在写实方面不稳定 - 可能会扭曲精细纹理或面部
  • 何时使用: 快速、创意、详细的动漫风格或概念艺术输出
Euler a example

DPM++ SDE Karras

  • 产生平滑、高质量的渐变和柔和的过渡
  • 非常适合较小的细节
  • 每次渲染都会有所不同 - 适合有机变化
  • 何时使用: 照片级真实渲染、自然光照、绘画风格、柔和过渡
DPM++ SDE Karras example

DPM++ 2M - 确定性

  • 产生平滑、一致的结果,具有高提示词保真度
  • 速度和准确性之间的良好平衡
  • 何时使用: 写实主义、肖像、稳定性重要的一致风格
DPM++ 2M example

DPM++ 2M Karras

  • 产生比普通DPM++ 2M更平滑的渐变、更好的纹理和更高的细节保真度
  • 比Euler A稍慢,但写实质量更高
  • 何时使用: 照片级真实图像、肖像、复杂纹理 - 最适合精致、稳定的外观
DPM++ 2M Karras example

提示词强度

提示词强度改变CFG比例 - 值越高,系统越遵循您的图像提示词。

  • 低CFG (1-5): 模型较少关注提示词。更多艺术自由,更梦幻的构图。风险:图像偏离您的要求。
  • 中等CFG (6-9): 遵循度与创造力之间的平衡。常见最佳值:7-8。保持准确性和美观性。
  • 高CFG (10+): 强烈遵循关键词。可能变得过饱和、刺眼或"烧焦"。风险:奇怪的伪影、僵硬或不自然的图像。

权重

+的实际权重是1.1^x(其中x = +的数量)。而-是0.9^x。

符号数量-的权重+的权重
10.91.1
20.811.21
30.7291.331
40.65611.4641
50.590491.61051
60.5314411.771561

免责声明:此表不是数学表!它是最终结果的视觉表示!

您可以利用系统:(keyword-)2等同于(keyword)1.8。更复杂的:(keyword---)2计算为(keyword 0.9^3)2 = 0.729 * 2 = (keyword)1.458

风格化

关键词和权重的组合可以实现某些所需的外观。使用painterly_shading的示例:

使用Painterly_shading+++不使用
Painterly shading exampleWithout stylization

您可以改变:

  • 风格/风格化 - 整体外观
  • 阴影/光照 - 体积和深度
  • 线稿 - 边缘的定义
  • 比例 - 主题的描绘方式
  • 纹理/细节 - 表面细节
  • 构图/取景 - 排列
  • 模拟 - 图片模拟的媒介
  • 质量 - 整体质量

预设和物理

图像提示词只有550个字符!您可以通过使用背景、服装预设和物理属性来获得更风格化的提示词,从而规避此限制。

Soulkyn上的预设规则:32个字符,18个标签。

技巧:

  • 使用分号;将多个含义打包到一个标签中
  • 使用下划线_为AI精确定位含义
  • 使用:2应用更强的权重(已归一化以防止爆炸)

示例:PaintFuka角色

物理标签: Painterly; Soft; No_lineart, 8K;16K; Hdr, Blue Lips, Slim Eyebrows; Fair_skin:2, Long Two-Toned Dark_blue Hair, Realistic_character_anatomy, High Quality, Highest_quality; Extremely_detailed, Adult_woman:2; Mature_woman:2, Realistic Details, Painterly Texture, Cute;Kawaii, Digital_painting:2, Thick Thighs; Slim Waist, High Contrast, Painterly Details, Long Blue Hair; Blue Eyes, Dramatic; Epic; Emotional

服装标签: Hyperdetailed_eyelashes, High_contrast:2; Shadows:2; Light:2, Realistic:2; Anime:2, Canvas_tone_texture; Hyperdetailed, Hyperdetailed_skin:2, Expressive;Hyperrealistic:2, Hyperdetailed_body:2; Cute:2, Glow_diffusion; Saturated_colors:2, Hyperdetailed_shading, Hyperdetailed_textures:2, Hyperdetailed_hair, Glowing_eyes:2; Big_eyes:2, Hyperdetailed_clothing:2, Hyperdetailed_eyes:2, Art Bloom; Soft; Hard; Hairstrands, Painterly_skin_softness; Kawaii:2;, Soft Light; Thick Thighs; Matte_skin:2, Realistic Anime; Soft Shading

背景: Glowing Highlights, Detailed Rendering, Vibrant Colors, Saturated Colors, Ambient Lighting, Anime Art Style, Cell Shading, Rim Lighting, Digital Painting, Semi-Realistic, Soft Shading, Smooth Gradients, Dramatic Lighting, Polished Finish, Professional Artwork, Clean Lineart, High Contrast, Artstation Quality; Highest Quality

PaintFuka example

分解部分物理属性:

  • Painterly - 更多绘画细节
  • Soft - 更柔和的图片
  • No_lineart - 无线稿(类似负面标签)
  • 8k; 16k / High Quality - 期望非常高的质量
  • Hdr - 光影之间更深的对比度
  • Blue lips - 角色有蓝色嘴唇
  • Fair_skin:2 - 真的想要白皙的皮肤
  • Long Two-Toned Dark_blue Hair - 有两种深蓝色调的长发
  • Realistic_character_anatomy - 真实的解剖结构

高级提示的结构

是时候运用我们所有的新知识来更有创意地制作提示词了!为此,我们将使用PaintFuka的背景和服装。

这是未风格化提示词和风格化提示词之间的比较:

未风格化风格化
Not stylizedStylized

首先让我们描述一下我们想要创建的图片:

  • 人数:1
  • 视角:牛仔镜头(膝盖以上视角)
  • 角色穿着白色夏季连衣裙
  • 角色在跑步时伸出一只手
  • 表情:微笑
  • 背景:不重要,可以模糊以突出角色
  • 质量:极其详细的真实插图

考虑到这个列表,让我们准备所有的LoRA、调度器和关键词。

因为我们希望图片类似于详细的真实插图,所以让我们使用专门用于此目的的LoRA!

这是应用微观/精细细节:6和真实插图:6 LoRA的结果:

使用LoRA不使用LoRA
With LoRAsWithout LoRAs

现在让我们给她穿上衣服并让她跑起来!

最终提示词:

高级设置:

  • LoRA: Micro / Fine details :6, Realistic Illustration :6
  • 提示词强度: 11.0
  • CLIP跳过: 2
  • 调度器: DPM++ 2M
  • 图像方向: 横向
  • 种子: 随机
  • 提示: Portrait
  • 背景: PaintFuka
  • 服装: PaintFuka
  • 图像提示词: (solo, alone)+++, (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++, (close, cowboy_shot)++++, (white_summer_dress---)2, (running)+++, (reaching_out, one_hand, outstretched_hand)+++, (smiling, Happy, open_mouth, closed_eyes)+, (blurry_background--)2

最终结果:

Final result

现在让我们分析提示词中包含的内容以及它是如何工作的:

  • (solo, alone)+++ - 使角色独自出现在图片中
  • (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++ - 这些告诉AI我们想要获得的图片质量
  • (close, cowboy_shot)++++ - 这告诉AI我们想要一个非常近的牛仔镜头
  • (white_summer_dress---)2 - 这强制AI给我们的角色穿上白色夏季连衣裙
  • (running)+++ - 这告诉AI我们想要角色在跑步
  • (reaching_out, one_hand, outstretched_hand)+++ - 这精确地告诉AI我们想要什么样的姿势
  • (smiling, Happy, open_mouth, closed_eyes)+ - 这定义了我们角色的表情
  • (blurry_background--)2 - 这强制AI给我们一个模糊的背景

作为额外内容,这是仅添加一个LoRA的效果:

Effect of adding one more LoRA

常见问题

最常见的问题是质量下降 - 一些用户称之为"地毯化",因为损坏的图像看起来像地毯表面的特写。

这很可能是由于:

  • 权重过多
  • LoRA强度过大
  • 标签冲突

修复

我们的网站提供AI辅助图像编辑。这是一个实验性功能,由于资源消耗而需要花费灵魂。

要编辑图像:

  1. 前往角色的图库
  2. 选择要编辑的图像
  3. 编辑图像按钮
Inpainting UI

与图像生成不同,修复使用描述性提示词。用可理解的句子向AI解释您想要什么。

示例: "将角色的头发变为白色,皮肤变为黑色"

结果:

Inpainting result example