Erweiterte Bildgenerierung

Dieser Leitfaden setzt voraus, dass Sie bereits die Grundlagen der Bildgenerierung kennen. Informationen aus dem Grundlagenleitfaden werden nicht erneut erklärt.

Unsere Website verwendet SDXL (Stable Diffusion eXtra Large) als Basis. Gewichtungen wurden vereinfacht und Syntaxen größtenteils deaktiviert, um den Benutzerkomfort zu erhöhen.

Dieser Leitfaden behandelt: Erweiterte Einstellungen (LoRA, Scheduler, Prompt-Stärke, CLIP Skip), Gewichtungen, Stilisierung, Vorlagen und Inpainting.

Erweiterte Einstellungen

Schichten (Layers)

Schichten sind „Blöcke", aus denen ein Bildmodell besteht. Denken Sie an Stable Diffusion als einen Turm aus Stockwerken - jeder „Block" hat seine eigene Aufgabe:

Frühe Schichten - Erfassen Details auf niedriger Ebene (Kanten, Farben, Texturen)
Mittlere Schichten - Erfassen Muster und Formen (Gesichter, Kleidung, Körperstruktur)
Späte Schichten - Erfassen semantische Bedeutung (Konzepte wie „Katze" vs. „Hund" oder „Anime-Stil" vs. „Foto")

LoRA

LoRAs sind Trainingsmethoden zur Feinabstimmung großer Modelle. Wenn Sie ein Bildmodell haben, bringen LoRAs ihm neue Tricks bei, indem sie sich in bestimmte Schichten einfügen - wie die Renovierung bestimmter Stockwerke im Turm.

CLIP Skip Layers

Stable Diffusion verwendet CLIP (Contrastive Language-Image Pre-training) als Textencoder, um Ihren Prompt in Embeddings umzuwandeln. CLIP ist im Grunde ein Übersetzer zwischen Ihnen und dem Bildmodell. Das Überspringen von Schichten unterbricht das Verständnis auf höherer Ebene.

Viele Anime-Modelle und LoRAs werden mit CLIP-Skip-Werten im Hinterkopf trainiert (meist 2). Das Überspringen einer Schicht kann Ihnen mehr anime-ähnliche oder stilisierte Ergebnisse liefern.

Scheduler

Der Scheduler steuert den Entrauschungsprozess während der Generierung. Er beeinflusst stark die Bildschärfe, Kohärenz und Prompt-Treue.

Euler a - Schnell

Erzeugt scharfe, detaillierte Bilder mit starkem Kontrast
Großartig für Anime, stilisierte Kunst oder skizzenhafte Details
Manchmal instabil bei Realismus - kann feine Texturen oder Gesichter verzerren
Wann verwenden: Schnelle, kreative, detaillierte Ausgaben für Anime-Stil oder Konzeptkunst

DPM++ SDE Karras

Erzeugt weiche, hochwertige Verläufe und sanfte Übergänge
Großartig für kleinere Details
Jede Ausgabe ist anders - gut für organische Variation
Wann verwenden: Fotorealistische Darstellungen, natürliche Beleuchtung, malerische Stile, sanfte Übergänge

DPM++ 2M - Deterministisch

Erzeugt weiche, konsistente Ergebnisse mit hoher Prompt-Treue
Gutes Gleichgewicht zwischen Geschwindigkeit und Genauigkeit
Wann verwenden: Realismus, Portraits, konsistente Stile, bei denen Stabilität wichtig ist

DPM++ 2M Karras

Erzeugt weichere Verläufe, bessere Textur und höhere Detailtreue als Standard-DPM++ 2M
Etwas langsamer als Euler A, aber höhere Qualität für Realismus
Wann verwenden: Fotorealistische Bilder, Portraits, komplexe Texturen - am besten für polierten, stabilen Look

Prompt-Stärke

Die Prompt-Stärke ändert die CFG-Skala - je höher der Wert, desto mehr folgt das System Ihrem Bild-Prompt.

Niedriges CFG (1-5): Modell achtet weniger auf den Prompt. Mehr künstlerische Freiheit, verträumtere Kompositionen. Risiko: Bild weicht von Ihrer Anfrage ab.
Mittleres CFG (6-9): Ausgewogene Treue vs. Kreativität. Üblicher Sweet Spot: 7-8. Erhält sowohl Genauigkeit als auch Ästhetik.
Hohes CFG (10+): Starke Einhaltung der Schlüsselwörter. Kann übersättigt, hart oder „verbrannt" werden. Risiko: Seltsame Artefakte, steife oder unnatürliche Bilder.

Gewichte

Das tatsächliche Gewicht von + ist 1.1^x (wobei x = Anzahl der +). Währenddessen ist - gleich 0.9^x.

Anzahl der Zeichen	Gewicht von -	Gewicht von +
1	0.9	1.1
2	0.81	1.21
3	0.729	1.331
4	0.6561	1.4641
5	0.59049	1.61051
6	0.531441	1.771561

HAFTUNGSAUSSCHLUSS: DIESE TABELLE IST KEINE MATHEMATISCHE TABELLE! ES IST EINE VISUELLE DARSTELLUNG DES ENDERGEBNISSES!

Sie können das System austricksen: (keyword-)2 ergibt das Äquivalent von (keyword)1.8. Komplexer: (keyword---)2 wird berechnet als (keyword 0.9^3)2 = 0.729 * 2 = (keyword)1.458

Stilisierung

Kombinationen von Schlüsselwörtern und Gewichtungen können bestimmte gewünschte Looks erzielen. Beispiel mit painterly_shading:

Mit Painterly_shading+++	Ohne

Sie können ändern:

Stil / Stilisierung - Gesamterscheinungsbild
Schattierung / Beleuchtung - Volumen und Tiefe
Line-art - Definition von Kanten
Proportionen - Wie Motive dargestellt werden
Textur / Detail - Oberflächendetails
Komposition / Rahmung - Anordnung
Simulation - Welches Medium das Bild simuliert
Qualität - Gesamtqualität

Voreinstellungen und Physikalität

Bild-Prompts haben nur 550 Zeichen! Sie können dies umgehen, indem Sie Hintergrund-, Kleidungsvorlagen und Physicals für stilisiertere Prompts verwenden.

Vorlagen-Regeln auf Soulkyn: 32 Zeichen, 18 Tags.

Tricks:

Verwenden Sie Semikolons ;, um mehrere Bedeutungen in ein Tag zu packen
Verwenden Sie Unterstriche _, um die Bedeutung für die KI präzise anzugeben
Verwenden Sie :2, um eine stärkere Gewichtung anzuwenden (normalisiert, um Explosion zu verhindern)

Beispiel: PaintFuka-Charakter

Physical Tags: Painterly; Soft; No_lineart, 8K;16K; Hdr, Blue Lips, Slim Eyebrows; Fair_skin:2, Long Two-Toned Dark_blue Hair, Realistic_character_anatomy, High Quality, Highest_quality; Extremely_detailed, Adult_woman:2; Mature_woman:2, Realistic Details, Painterly Texture, Cute;Kawaii, Digital_painting:2, Thick Thighs; Slim Waist, High Contrast, Painterly Details, Long Blue Hair; Blue Eyes, Dramatic; Epic; Emotional

Kleidungs-Tags: Hyperdetailed_eyelashes, High_contrast:2; Shadows:2; Light:2, Realistic:2; Anime:2, Canvas_tone_texture; Hyperdetailed, Hyperdetailed_skin:2, Expressive;Hyperrealistic:2, Hyperdetailed_body:2; Cute:2, Glow_diffusion; Saturated_colors:2, Hyperdetailed_shading, Hyperdetailed_textures:2, Hyperdetailed_hair, Glowing_eyes:2; Big_eyes:2, Hyperdetailed_clothing:2, Hyperdetailed_eyes:2, Art Bloom; Soft; Hard; Hairstrands, Painterly_skin_softness; Kawaii:2;, Soft Light; Thick Thighs; Matte_skin:2, Realistic Anime; Soft Shading

Hintergrund: Glowing Highlights, Detailed Rendering, Vibrant Colors, Saturated Colors, Ambient Lighting, Anime Art Style, Cell Shading, Rim Lighting, Digital Painting, Semi-Realistic, Soft Shading, Smooth Gradients, Dramatic Lighting, Polished Finish, Professional Artwork, Clean Lineart, High Contrast, Artstation Quality; Highest Quality

Aufschlüsselung eines Teils der Physicals:

Painterly - Mehr gemalte Details
Soft - Weicheres Bild
No_lineart - Keine Line-art (negativähnliches Tag)
8k; 16k / High Quality - Sehr hohe Qualität gewünscht
Hdr - Tieferer Kontrast zwischen Lichtern und Schatten
Blue lips - Charakter hat blaue Lippen
Fair_skin:2 - Will wirklich helle Haut
Long Two-Toned Dark_blue Hair - Langes Haar mit zwei Blautönen
Realistic_character_anatomy - Realistische Anatomie

Anatomie eines erweiterten Prompts

Es ist Zeit, all unser neu erworbenes Wissen zu nutzen, um mit unseren Prompts kreativer zu sein! Dafür verwenden wir PaintFukas Hintergrund und Kleidung.

Hier ist ein Vergleich zwischen nicht stilisierten und stilisierten Prompts:

Nicht stilisiert	Stilisiert

Lassen Sie uns zuerst ein Bild beschreiben, das wir erstellen wollen:

Anzahl der Personen: 1
Perspektive: Cowboy-Shot (Knie-aufwärts-Perspektive)
Charakter trägt ein weißes Sommerkleid
Charakter läuft während er eine Hand ausstreckt
Ausdruck: Lächelnd
Hintergrund: Nicht wichtig, kann verschwommen sein, damit der Charakter hervorsticht
Qualität: Extrem detailliert, realistische Illustration

Unter Berücksichtigung dieser Liste bereiten wir alle LoRAs, Scheduler und Schlüsselwörter vor.

Da wir möchten, dass das Bild einer detaillierten realistischen Illustration ähnelt, verwenden wir LoRAs genau dafür!

Hier ist das Ergebnis der Anwendung von Micro / Fine details :6 und Realistic Illustration :6 LoRAs:

Mit LoRAs	Ohne LoRAs

Jetzt ziehen wir ihr Kleidung an und lassen sie laufen!

Finaler Prompt:

Erweiterte Einstellungen:

LoRA: Micro / Fine details :6, Realistic Illustration :6
Prompt-Stärke: 11.0
CLIP Skip: 2
Scheduler: DPM++ 2M
Bildausrichtung: Landscape
Seed: Random
Prompt: Portrait
Hintergrund: PaintFuka
Kleidung: PaintFuka
Bild-Prompt: (solo, alone)+++, (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++, (close, cowboy_shot)++++, (white_summer_dress---)2, (running)+++, (reaching_out, one_hand, outstretched_hand)+++, (smiling, Happy, open_mouth, closed_eyes)+, (blurry_background--)2

Endergebnis:

Lassen Sie uns nun analysieren, was in den Prompt eingeflossen ist und wie es funktioniert:

(solo, alone)+++ - lässt den Charakter allein im Bild erscheinen
(macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++ - diese informieren die KI über die Qualität des Bildes, das wir erhalten möchten
(close, cowboy_shot)++++ - Dies sagt der KI, dass wir einen wirklich nahen Cowboy-Shot wollen
(white_summer_dress---)2 - Dies zwingt die KI, unserem Charakter ein weißes Sommerkleid zu geben
(running)+++ - Dies sagt der KI, dass wir möchten, dass unser Charakter läuft
(reaching_out, one_hand, outstretched_hand)+++ - Dies sagt der KI präzise, welche Art von Pose wir wollen
(smiling, Happy, open_mouth, closed_eyes)+ - Dies definiert den Ausdruck unseres Charakters
(blurry_background--)2 - Dies zwingt die KI, uns einen verschwommenen Hintergrund zu geben

Als Extra ist dies der Effekt, wenn man nur eine weitere LoRA hinzufügt:

Häufige Probleme

Das häufigste Problem ist die Qualitätsverschlechterung - einige Benutzer nennen dies „Verfilzung", weil beschädigte Bilder wie Nahaufnahmen von Teppichoberflächen aussehen.

Dies liegt höchstwahrscheinlich an:

Zu viel Gewichtung
Zu viel Stärke bei LoRAs
Widersprüchlichen Tags

Inpainting

Unsere Website bietet KI-gestützte Bildbearbeitung. Dies ist eine experimentelle Funktion, die aufgrund des Ressourcenaufwands Souls kostet.

Um ein Bild zu bearbeiten:

Gehen Sie zur Galerie des Charakters
Wählen Sie das zu bearbeitende Bild aus
Drücken Sie die Schaltfläche BILD BEARBEITEN

Im Gegensatz zur Bildgenerierung verwendet Inpainting beschreibendes Prompting. Erklären Sie der KI in verständlichen Sätzen, was Sie wollen.

Beispiel: „Ändere die Haare des Charakters zu weiß und die Haut zu schwarz"

Das Ergebnis: