Generación avanzada de imágenes

Esta guía asume que ya conoces los conceptos básicos de generación de imágenes. La información de la guía básica no se explicará de nuevo.

Nuestro sitio usa SDXL (Stable Diffusion eXtra Large) como base. Los pesos han sido simplificados y las sintaxis mayormente deshabilitadas para la comodidad del usuario.

Esta guía cubre: Configuraciones avanzadas (LoRA, scheduler, prompt strength, CLIP skip), pesos, estilización, presets, e inpainting.

Configuración avanzada

Capas

Las capas son "bloques" que componen un modelo de imagen. Piensa en Stable Diffusion como una torre hecha de pisos - cada "bloque" tiene su propio trabajo:

Capas tempranas - Capturan detalles de bajo nivel (bordes, colores, texturas)
Capas medias - Capturan patrones y formas (caras, ropa, estructura corporal)
Capas tardías - Capturan significado semántico (conceptos como "gato" vs "perro" o "estilo anime" vs "foto")

LoRA

Los LoRAs son métodos de entrenamiento para ajustar modelos grandes. Cuando tienes un modelo de imagen, los LoRAs le enseñan nuevos trucos inyectándose en ciertas capas - como remodelar pisos específicos en la torre.

CLIP Skip Layers

Stable Diffusion usa CLIP (Contrastive Language-Image Pre-training) como codificador de texto para convertir tu prompt en embeddings. CLIP es básicamente un traductor entre tú y el modelo de imagen. Saltar capas corta la comprensión de alto nivel.

Muchos modelos anime y LoRAs están entrenados con valores de CLIP skip en mente (más frecuentemente 2). Saltar una capa podría darte resultados más tipo anime o estilizados.

Scheduler

El scheduler controla el proceso de denoising durante la generación. Afecta fuertemente la nitidez de la imagen, coherencia, y adherencia al prompt.

Euler a - Fast

Produce imágenes nítidas y detalladas con fuerte contraste
Excelente para anime, arte estilizado, o detalles tipo boceto
A veces inestable con realismo - puede distorsionar texturas finas o caras
Cuándo usar: Resultados rápidos, creativos y detallados para estilo anime o arte conceptual

DPM++ SDE Karras

Produce gradientes suaves de alta calidad y transiciones suaves
Excelente para detalles más pequeños
Cada renderizado sale diferente - bueno para variación orgánica
Cuándo usar: Renderizados fotorrealistas, iluminación natural, estilos pictóricos, transiciones suaves

DPM++ 2M - Deterministic

Produce resultados suaves y consistentes con alta fidelidad al prompt
Buen balance entre velocidad y precisión
Cuándo usar: Realismo, retratos, estilos consistentes donde la estabilidad importa

DPM++ 2M Karras

Produce gradientes más suaves, mejor textura, y mayor fidelidad de detalle que el DPM++ 2M vanilla
Ligeramente más lento que Euler A, pero mayor calidad para realismo
Cuándo usar: Imágenes fotorrealistas, retratos, texturas complejas - mejor para apariencia pulida y estable

Prompt Strength

Prompt strength cambia la escala CFG - cuanto mayor el valor, más el sistema sigue tu prompt de imagen.

CFG Bajo (1-5): El modelo presta menos atención al prompt. Más libertad artística, composiciones más oníricas. Riesgo: La imagen se desvía de lo que pediste.
CFG Medio (6-9): Adherencia balanceada vs creatividad. Punto dulce común: 7-8. Mantiene tanto precisión como estética.
CFG Alto (10+): Fuerte adherencia a palabras clave. Puede volverse sobresaturado, áspero, o "quemado". Riesgo: Artefactos extraños, imágenes rígidas o no naturales.

Pesos

El peso real de + es 1.1^x (donde x = número de +). Mientras tanto - es 0.9^x.

# de signos	Peso de -	Peso de +
1	0.9	1.1
2	0.81	1.21
3	0.729	1.331
4	0.6561	1.4641
5	0.59049	1.61051
6	0.531441	1.771561

ADVERTENCIA: ¡ESTA TABLA NO ES UNA TABLA MATEMÁTICA! ¡ES UNA REPRESENTACIÓN VISUAL DEL RESULTADO FINAL!

Puedes engañar al sistema: (keyword-)2 da el equivalente de (keyword)1.8. Más complejo: (keyword---)2 se calcula como (keyword 0.9^3)2 = 0.729 * 2 = (keyword)1.458

Estilización

Las combinaciones de palabras clave y pesos pueden lograr ciertas apariencias deseadas. Ejemplo con painterly_shading:

Con Painterly_shading+++	Sin

Puedes cambiar:

Estilo / Estilización - Apariencia general
Sombreado / Iluminación - Volumen y profundidad
Line-art - Definición de bordes
Proporciones - Cómo se representan los sujetos
Textura / Detalle - Detalles de superficie
Composición / Encuadre - Arreglo
Simulación - Qué medio simula la imagen
Calidad - Calidad general

Preajustes y físicos

¡Los prompts de imagen tienen solo 550 caracteres! Puedes evitar esto usando presets de fondo, ropa, y físicos para prompts más estilizados.

Reglas de presets en Soulkyn: 32 caracteres, 18 etiquetas.

Trucos:

Usa punto y coma ; para empaquetar múltiples significados en una etiqueta
Usa guiones bajos _ para precisar el significado para la IA
Usa :2 para aplicar un peso más fuerte (normalizado para prevenir explosión)

Ejemplo: Personaje PaintFuka

Etiquetas físicas: Painterly; Soft; No_lineart, 8K;16K; Hdr, Blue Lips, Slim Eyebrows; Fair_skin:2, Long Two-Toned Dark_blue Hair, Realistic_character_anatomy, High Quality, Highest_quality; Extremely_detailed, Adult_woman:2; Mature_woman:2, Realistic Details, Painterly Texture, Cute;Kawaii, Digital_painting:2, Thick Thighs; Slim Waist, High Contrast, Painterly Details, Long Blue Hair; Blue Eyes, Dramatic; Epic; Emotional

Etiquetas de ropa: Hyperdetailed_eyelashes, High_contrast:2; Shadows:2; Light:2, Realistic:2; Anime:2, Canvas_tone_texture; Hyperdetailed, Hyperdetailed_skin:2, Expressive;Hyperrealistic:2, Hyperdetailed_body:2; Cute:2, Glow_diffusion; Saturated_colors:2, Hyperdetailed_shading, Hyperdetailed_textures:2, Hyperdetailed_hair, Glowing_eyes:2; Big_eyes:2, Hyperdetailed_clothing:2, Hyperdetailed_eyes:2, Art Bloom; Soft; Hard; Hairstrands, Painterly_skin_softness; Kawaii:2;, Soft Light; Thick Thighs; Matte_skin:2, Realistic Anime; Soft Shading

Fondo: Glowing Highlights, Detailed Rendering, Vibrant Colors, Saturated Colors, Ambient Lighting, Anime Art Style, Cell Shading, Rim Lighting, Digital Painting, Semi-Realistic, Soft Shading, Smooth Gradients, Dramatic Lighting, Polished Finish, Professional Artwork, Clean Lineart, High Contrast, Artstation Quality; Highest Quality

Desglosando parte de los físicos:

Painterly - Más detalles pintados
Soft - Imagen más suave
No_lineart - Sin line-art (etiqueta tipo negativa)
8k; 16k / High Quality - Muy alta calidad deseada
Hdr - Contraste más profundo entre luces y sombras
Blue lips - El personaje tiene labios azules
Fair_skin:2 - Realmente quiero piel clara
Long Two-Toned Dark_blue Hair - Cabello largo con dos tonos de azul
Realistic_character_anatomy - Anatomía realista

Anatomía de un prompt avanzado

¡Es hora de usar todo nuestro conocimiento recién adquirido para ser más creativos con nuestros prompts! Para esto usaremos el Fondo y Ropa de PaintFuka.

Aquí hay una comparación entre prompts no estilizados y uno estilizado:

No estilizado	Estilizado

Primero describamos una imagen que queremos crear:

Cantidad de personas: 1
Perspectiva: cowboy shot (perspectiva desde las rodillas hacia arriba)
Personaje vistiendo un vestido de verano blanco
Personaje está corriendo mientras extiende una mano
Expresión: Sonriendo
Fondo: No importante, puede ser borroso para hacer destacar al personaje
Calidad: Extremadamente detallada, ilustración realista

Tomando esta lista en cuenta, preparemos todos los loras, scheduler, y palabras clave.

¡Porque queremos que la imagen se asemeje a una ilustración realista detallada, usemos LoRAs justo para eso!

Aquí está el resultado de aplicar los LoRAs Micro / Fine details :6 y Realistic Illustration :6:

Con LoRAs	Sin LoRAs

¡Ahora pongámosle ropa y hagámosla correr!

Prompt final:

Configuraciones avanzadas:

LoRA: Micro / Fine details :6, Realistic Illustration :6
Prompt Strength: 11.0
CLIP Skip: 2
Scheduler: DPM++ 2M
Image Orientation: Landscape
Seed: Random
Prompt: Portrait
Background: PaintFuka
Clothes: PaintFuka
Image Prompt: (solo, alone)+++, (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++, (close, cowboy_shot)++++, (white_summer_dress---)2, (running)+++, (reaching_out, one_hand, outstretched_hand)+++, (smiling, Happy, open_mouth, closed_eyes)+, (blurry_background--)2

Resultado final:

Ahora analicemos qué entró en el prompt y cómo funciona:

(solo, alone)+++ - hace que el personaje aparezca solo en la imagen
(macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++ - estos le dicen a la IA sobre la calidad de la imagen que queremos obtener
(close, cowboy_shot)++++ - Esto le dice a la IA que queremos un cowboy shot realmente cercano
(white_summer_dress---)2 - Esto fuerza a la IA a darle a nuestro personaje un vestido de verano blanco
(running)+++ - Esto le dice a la IA que queremos que nuestro personaje esté corriendo
(reaching_out, one_hand, outstretched_hand)+++ - Esto le dice precisamente a la IA qué tipo de pose queremos
(smiling, Happy, open_mouth, closed_eyes)+ - Esto define la expresión de nuestro personaje
(blurry_background--)2 - Esto fuerza a la IA a darnos un fondo borroso

Como extra, este es el efecto de agregar solo un LoRA más:

Problemas comunes

El problema más común es la degradación de calidad - algunos usuarios llaman a esto "carpetización" porque las imágenes rotas se ven como primeros planos de superficie de alfombra.

Esto es muy probablemente debido a:

Demasiado peso
Demasiada fuerza en los LoRAs
Etiquetas en conflicto

Inpainting

Nuestro sitio web ofrece edición de imágenes asistida por IA. Esta es una función experimental que cuesta almas debido al gasto de recursos.

Para editar una imagen:

Ve a la galería del personaje
Elige la imagen a editar
Presiona el botón EDIT IMAGE

A diferencia de la generación de imágenes, el inpainting usa prompts descriptivos. Explícale a la IA lo que quieres en oraciones comprensibles.

Ejemplo: "Cambia el cabello del personaje a blanco y la piel a negro"

El resultado: