Soulkyn AI-Logo

Erweiterte Bildgenerierung

Dieser Leitfaden setzt voraus, dass Sie bereits die Grundlagen der Bildgenerierung kennen. Informationen aus dem Grundlagenleitfaden werden nicht erneut erklärt.

Unsere Website verwendet SDXL (Stable Diffusion eXtra Large) als Basis. Gewichtungen wurden vereinfacht und Syntaxen größtenteils deaktiviert, um den Benutzerkomfort zu erhöhen.

Dieser Leitfaden behandelt: Erweiterte Einstellungen (LoRA, Scheduler, Prompt-Stärke, CLIP Skip), Gewichtungen, Stilisierung, Vorlagen und Inpainting.

Erweiterte Einstellungen

Advanced settings panel

Schichten (Layers)

Schichten sind „Blöcke", aus denen ein Bildmodell besteht. Denken Sie an Stable Diffusion als einen Turm aus Stockwerken - jeder „Block" hat seine eigene Aufgabe:

  • Frühe Schichten - Erfassen Details auf niedriger Ebene (Kanten, Farben, Texturen)
  • Mittlere Schichten - Erfassen Muster und Formen (Gesichter, Kleidung, Körperstruktur)
  • Späte Schichten - Erfassen semantische Bedeutung (Konzepte wie „Katze" vs. „Hund" oder „Anime-Stil" vs. „Foto")

LoRA

LoRAs sind Trainingsmethoden zur Feinabstimmung großer Modelle. Wenn Sie ein Bildmodell haben, bringen LoRAs ihm neue Tricks bei, indem sie sich in bestimmte Schichten einfügen - wie die Renovierung bestimmter Stockwerke im Turm.

CLIP Skip Layers

Stable Diffusion verwendet CLIP (Contrastive Language-Image Pre-training) als Textencoder, um Ihren Prompt in Embeddings umzuwandeln. CLIP ist im Grunde ein Übersetzer zwischen Ihnen und dem Bildmodell. Das Überspringen von Schichten unterbricht das Verständnis auf höherer Ebene.

Viele Anime-Modelle und LoRAs werden mit CLIP-Skip-Werten im Hinterkopf trainiert (meist 2). Das Überspringen einer Schicht kann Ihnen mehr anime-ähnliche oder stilisierte Ergebnisse liefern.

Scheduler

Der Scheduler steuert den Entrauschungsprozess während der Generierung. Er beeinflusst stark die Bildschärfe, Kohärenz und Prompt-Treue.

Euler a - Schnell

  • Erzeugt scharfe, detaillierte Bilder mit starkem Kontrast
  • Großartig für Anime, stilisierte Kunst oder skizzenhafte Details
  • Manchmal instabil bei Realismus - kann feine Texturen oder Gesichter verzerren
  • Wann verwenden: Schnelle, kreative, detaillierte Ausgaben für Anime-Stil oder Konzeptkunst
Euler a example

DPM++ SDE Karras

  • Erzeugt weiche, hochwertige Verläufe und sanfte Übergänge
  • Großartig für kleinere Details
  • Jede Ausgabe ist anders - gut für organische Variation
  • Wann verwenden: Fotorealistische Darstellungen, natürliche Beleuchtung, malerische Stile, sanfte Übergänge
DPM++ SDE Karras example

DPM++ 2M - Deterministisch

  • Erzeugt weiche, konsistente Ergebnisse mit hoher Prompt-Treue
  • Gutes Gleichgewicht zwischen Geschwindigkeit und Genauigkeit
  • Wann verwenden: Realismus, Portraits, konsistente Stile, bei denen Stabilität wichtig ist
DPM++ 2M example

DPM++ 2M Karras

  • Erzeugt weichere Verläufe, bessere Textur und höhere Detailtreue als Standard-DPM++ 2M
  • Etwas langsamer als Euler A, aber höhere Qualität für Realismus
  • Wann verwenden: Fotorealistische Bilder, Portraits, komplexe Texturen - am besten für polierten, stabilen Look
DPM++ 2M Karras example

Prompt-Stärke

Die Prompt-Stärke ändert die CFG-Skala - je höher der Wert, desto mehr folgt das System Ihrem Bild-Prompt.

  • Niedriges CFG (1-5): Modell achtet weniger auf den Prompt. Mehr künstlerische Freiheit, verträumtere Kompositionen. Risiko: Bild weicht von Ihrer Anfrage ab.
  • Mittleres CFG (6-9): Ausgewogene Treue vs. Kreativität. Üblicher Sweet Spot: 7-8. Erhält sowohl Genauigkeit als auch Ästhetik.
  • Hohes CFG (10+): Starke Einhaltung der Schlüsselwörter. Kann übersättigt, hart oder „verbrannt" werden. Risiko: Seltsame Artefakte, steife oder unnatürliche Bilder.

Gewichte

Das tatsächliche Gewicht von + ist 1.1^x (wobei x = Anzahl der +). Währenddessen ist - gleich 0.9^x.

Anzahl der ZeichenGewicht von -Gewicht von +
10.91.1
20.811.21
30.7291.331
40.65611.4641
50.590491.61051
60.5314411.771561

HAFTUNGSAUSSCHLUSS: DIESE TABELLE IST KEINE MATHEMATISCHE TABELLE! ES IST EINE VISUELLE DARSTELLUNG DES ENDERGEBNISSES!

Sie können das System austricksen: (keyword-)2 ergibt das Äquivalent von (keyword)1.8. Komplexer: (keyword---)2 wird berechnet als (keyword 0.9^3)2 = 0.729 * 2 = (keyword)1.458

Stilisierung

Kombinationen von Schlüsselwörtern und Gewichtungen können bestimmte gewünschte Looks erzielen. Beispiel mit painterly_shading:

Mit Painterly_shading+++Ohne
Painterly shading exampleWithout stylization

Sie können ändern:

  • Stil / Stilisierung - Gesamterscheinungsbild
  • Schattierung / Beleuchtung - Volumen und Tiefe
  • Line-art - Definition von Kanten
  • Proportionen - Wie Motive dargestellt werden
  • Textur / Detail - Oberflächendetails
  • Komposition / Rahmung - Anordnung
  • Simulation - Welches Medium das Bild simuliert
  • Qualität - Gesamtqualität

Voreinstellungen und Physikalität

Bild-Prompts haben nur 550 Zeichen! Sie können dies umgehen, indem Sie Hintergrund-, Kleidungsvorlagen und Physicals für stilisiertere Prompts verwenden.

Vorlagen-Regeln auf Soulkyn: 32 Zeichen, 18 Tags.

Tricks:

  • Verwenden Sie Semikolons ;, um mehrere Bedeutungen in ein Tag zu packen
  • Verwenden Sie Unterstriche _, um die Bedeutung für die KI präzise anzugeben
  • Verwenden Sie :2, um eine stärkere Gewichtung anzuwenden (normalisiert, um Explosion zu verhindern)

Beispiel: PaintFuka-Charakter

Physical Tags: Painterly; Soft; No_lineart, 8K;16K; Hdr, Blue Lips, Slim Eyebrows; Fair_skin:2, Long Two-Toned Dark_blue Hair, Realistic_character_anatomy, High Quality, Highest_quality; Extremely_detailed, Adult_woman:2; Mature_woman:2, Realistic Details, Painterly Texture, Cute;Kawaii, Digital_painting:2, Thick Thighs; Slim Waist, High Contrast, Painterly Details, Long Blue Hair; Blue Eyes, Dramatic; Epic; Emotional

Kleidungs-Tags: Hyperdetailed_eyelashes, High_contrast:2; Shadows:2; Light:2, Realistic:2; Anime:2, Canvas_tone_texture; Hyperdetailed, Hyperdetailed_skin:2, Expressive;Hyperrealistic:2, Hyperdetailed_body:2; Cute:2, Glow_diffusion; Saturated_colors:2, Hyperdetailed_shading, Hyperdetailed_textures:2, Hyperdetailed_hair, Glowing_eyes:2; Big_eyes:2, Hyperdetailed_clothing:2, Hyperdetailed_eyes:2, Art Bloom; Soft; Hard; Hairstrands, Painterly_skin_softness; Kawaii:2;, Soft Light; Thick Thighs; Matte_skin:2, Realistic Anime; Soft Shading

Hintergrund: Glowing Highlights, Detailed Rendering, Vibrant Colors, Saturated Colors, Ambient Lighting, Anime Art Style, Cell Shading, Rim Lighting, Digital Painting, Semi-Realistic, Soft Shading, Smooth Gradients, Dramatic Lighting, Polished Finish, Professional Artwork, Clean Lineart, High Contrast, Artstation Quality; Highest Quality

PaintFuka example

Aufschlüsselung eines Teils der Physicals:

  • Painterly - Mehr gemalte Details
  • Soft - Weicheres Bild
  • No_lineart - Keine Line-art (negativähnliches Tag)
  • 8k; 16k / High Quality - Sehr hohe Qualität gewünscht
  • Hdr - Tieferer Kontrast zwischen Lichtern und Schatten
  • Blue lips - Charakter hat blaue Lippen
  • Fair_skin:2 - Will wirklich helle Haut
  • Long Two-Toned Dark_blue Hair - Langes Haar mit zwei Blautönen
  • Realistic_character_anatomy - Realistische Anatomie

Anatomie eines erweiterten Prompts

Es ist Zeit, all unser neu erworbenes Wissen zu nutzen, um mit unseren Prompts kreativer zu sein! Dafür verwenden wir PaintFukas Hintergrund und Kleidung.

Hier ist ein Vergleich zwischen nicht stilisierten und stilisierten Prompts:

Nicht stilisiertStilisiert
Not stylizedStylized

Lassen Sie uns zuerst ein Bild beschreiben, das wir erstellen wollen:

  • Anzahl der Personen: 1
  • Perspektive: Cowboy-Shot (Knie-aufwärts-Perspektive)
  • Charakter trägt ein weißes Sommerkleid
  • Charakter läuft während er eine Hand ausstreckt
  • Ausdruck: Lächelnd
  • Hintergrund: Nicht wichtig, kann verschwommen sein, damit der Charakter hervorsticht
  • Qualität: Extrem detailliert, realistische Illustration

Unter Berücksichtigung dieser Liste bereiten wir alle LoRAs, Scheduler und Schlüsselwörter vor.

Da wir möchten, dass das Bild einer detaillierten realistischen Illustration ähnelt, verwenden wir LoRAs genau dafür!

Hier ist das Ergebnis der Anwendung von Micro / Fine details :6 und Realistic Illustration :6 LoRAs:

Mit LoRAsOhne LoRAs
With LoRAsWithout LoRAs

Jetzt ziehen wir ihr Kleidung an und lassen sie laufen!

Finaler Prompt:

Erweiterte Einstellungen:

  • LoRA: Micro / Fine details :6, Realistic Illustration :6
  • Prompt-Stärke: 11.0
  • CLIP Skip: 2
  • Scheduler: DPM++ 2M
  • Bildausrichtung: Landscape
  • Seed: Random
  • Prompt: Portrait
  • Hintergrund: PaintFuka
  • Kleidung: PaintFuka
  • Bild-Prompt: (solo, alone)+++, (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++, (close, cowboy_shot)++++, (white_summer_dress---)2, (running)+++, (reaching_out, one_hand, outstretched_hand)+++, (smiling, Happy, open_mouth, closed_eyes)+, (blurry_background--)2

Endergebnis:

Final result

Lassen Sie uns nun analysieren, was in den Prompt eingeflossen ist und wie es funktioniert:

  • (solo, alone)+++ - lässt den Charakter allein im Bild erscheinen
  • (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++ - diese informieren die KI über die Qualität des Bildes, das wir erhalten möchten
  • (close, cowboy_shot)++++ - Dies sagt der KI, dass wir einen wirklich nahen Cowboy-Shot wollen
  • (white_summer_dress---)2 - Dies zwingt die KI, unserem Charakter ein weißes Sommerkleid zu geben
  • (running)+++ - Dies sagt der KI, dass wir möchten, dass unser Charakter läuft
  • (reaching_out, one_hand, outstretched_hand)+++ - Dies sagt der KI präzise, welche Art von Pose wir wollen
  • (smiling, Happy, open_mouth, closed_eyes)+ - Dies definiert den Ausdruck unseres Charakters
  • (blurry_background--)2 - Dies zwingt die KI, uns einen verschwommenen Hintergrund zu geben

Als Extra ist dies der Effekt, wenn man nur eine weitere LoRA hinzufügt:

Effect of adding one more LoRA

Häufige Probleme

Das häufigste Problem ist die Qualitätsverschlechterung - einige Benutzer nennen dies „Verfilzung", weil beschädigte Bilder wie Nahaufnahmen von Teppichoberflächen aussehen.

Dies liegt höchstwahrscheinlich an:

  • Zu viel Gewichtung
  • Zu viel Stärke bei LoRAs
  • Widersprüchlichen Tags

Inpainting

Unsere Website bietet KI-gestützte Bildbearbeitung. Dies ist eine experimentelle Funktion, die aufgrund des Ressourcenaufwands Souls kostet.

Um ein Bild zu bearbeiten:

  1. Gehen Sie zur Galerie des Charakters
  2. Wählen Sie das zu bearbeitende Bild aus
  3. Drücken Sie die Schaltfläche BILD BEARBEITEN
Inpainting UI

Im Gegensatz zur Bildgenerierung verwendet Inpainting beschreibendes Prompting. Erklären Sie der KI in verständlichen Sätzen, was Sie wollen.

Beispiel: „Ändere die Haare des Charakters zu weiß und die Haut zu schwarz"

Das Ergebnis:

Inpainting result example