Generación avanzada de imágenes
Esta guía asume que ya conoces los conceptos básicos de generación de imágenes. La información de la guía básica no se explicará de nuevo.
Nuestro sitio usa SDXL (Stable Diffusion eXtra Large) como base. Los pesos han sido simplificados y las sintaxis mayormente deshabilitadas para la comodidad del usuario.
Esta guía cubre: Configuraciones avanzadas (LoRA, scheduler, prompt strength, CLIP skip), pesos, estilización, presets, e inpainting.
Configuración avanzada
Capas
Las capas son "bloques" que componen un modelo de imagen. Piensa en Stable Diffusion como una torre hecha de pisos - cada "bloque" tiene su propio trabajo:
- Capas tempranas - Capturan detalles de bajo nivel (bordes, colores, texturas)
- Capas medias - Capturan patrones y formas (caras, ropa, estructura corporal)
- Capas tardías - Capturan significado semántico (conceptos como "gato" vs "perro" o "estilo anime" vs "foto")
LoRA
Los LoRAs son métodos de entrenamiento para ajustar modelos grandes. Cuando tienes un modelo de imagen, los LoRAs le enseñan nuevos trucos inyectándose en ciertas capas - como remodelar pisos específicos en la torre.
CLIP Skip Layers
Stable Diffusion usa CLIP (Contrastive Language-Image Pre-training) como codificador de texto para convertir tu prompt en embeddings. CLIP es básicamente un traductor entre tú y el modelo de imagen. Saltar capas corta la comprensión de alto nivel.
Muchos modelos anime y LoRAs están entrenados con valores de CLIP skip en mente (más frecuentemente 2). Saltar una capa podría darte resultados más tipo anime o estilizados.
Scheduler
El scheduler controla el proceso de denoising durante la generación. Afecta fuertemente la nitidez de la imagen, coherencia, y adherencia al prompt.
Euler a - Fast
- Produce imágenes nítidas y detalladas con fuerte contraste
- Excelente para anime, arte estilizado, o detalles tipo boceto
- A veces inestable con realismo - puede distorsionar texturas finas o caras
- Cuándo usar: Resultados rápidos, creativos y detallados para estilo anime o arte conceptual
DPM++ SDE Karras
- Produce gradientes suaves de alta calidad y transiciones suaves
- Excelente para detalles más pequeños
- Cada renderizado sale diferente - bueno para variación orgánica
- Cuándo usar: Renderizados fotorrealistas, iluminación natural, estilos pictóricos, transiciones suaves
DPM++ 2M - Deterministic
- Produce resultados suaves y consistentes con alta fidelidad al prompt
- Buen balance entre velocidad y precisión
- Cuándo usar: Realismo, retratos, estilos consistentes donde la estabilidad importa
DPM++ 2M Karras
- Produce gradientes más suaves, mejor textura, y mayor fidelidad de detalle que el DPM++ 2M vanilla
- Ligeramente más lento que Euler A, pero mayor calidad para realismo
- Cuándo usar: Imágenes fotorrealistas, retratos, texturas complejas - mejor para apariencia pulida y estable
Prompt Strength
Prompt strength cambia la escala CFG - cuanto mayor el valor, más el sistema sigue tu prompt de imagen.
- CFG Bajo (1-5): El modelo presta menos atención al prompt. Más libertad artística, composiciones más oníricas. Riesgo: La imagen se desvía de lo que pediste.
- CFG Medio (6-9): Adherencia balanceada vs creatividad. Punto dulce común: 7-8. Mantiene tanto precisión como estética.
- CFG Alto (10+): Fuerte adherencia a palabras clave. Puede volverse sobresaturado, áspero, o "quemado". Riesgo: Artefactos extraños, imágenes rígidas o no naturales.
Pesos
El peso real de + es 1.1^x (donde x = número de +). Mientras tanto - es 0.9^x.
| # de signos | Peso de - | Peso de + |
|---|---|---|
| 1 | 0.9 | 1.1 |
| 2 | 0.81 | 1.21 |
| 3 | 0.729 | 1.331 |
| 4 | 0.6561 | 1.4641 |
| 5 | 0.59049 | 1.61051 |
| 6 | 0.531441 | 1.771561 |
ADVERTENCIA: ¡ESTA TABLA NO ES UNA TABLA MATEMÁTICA! ¡ES UNA REPRESENTACIÓN VISUAL DEL RESULTADO FINAL!
Puedes engañar al sistema: (keyword-)2 da el equivalente de (keyword)1.8. Más complejo: (keyword---)2 se calcula como (keyword 0.9^3)2 = 0.729 * 2 = (keyword)1.458
Estilización
Las combinaciones de palabras clave y pesos pueden lograr ciertas apariencias deseadas. Ejemplo con painterly_shading:
| Con Painterly_shading+++ | Sin |
|---|---|
![]() | ![]() |
Puedes cambiar:
- Estilo / Estilización - Apariencia general
- Sombreado / Iluminación - Volumen y profundidad
- Line-art - Definición de bordes
- Proporciones - Cómo se representan los sujetos
- Textura / Detalle - Detalles de superficie
- Composición / Encuadre - Arreglo
- Simulación - Qué medio simula la imagen
- Calidad - Calidad general
Preajustes y físicos
¡Los prompts de imagen tienen solo 550 caracteres! Puedes evitar esto usando presets de fondo, ropa, y físicos para prompts más estilizados.
Reglas de presets en Soulkyn: 32 caracteres, 18 etiquetas.
Trucos:
- Usa punto y coma
;para empaquetar múltiples significados en una etiqueta - Usa guiones bajos
_para precisar el significado para la IA - Usa
:2para aplicar un peso más fuerte (normalizado para prevenir explosión)
Ejemplo: Personaje PaintFuka
Etiquetas físicas: Painterly; Soft; No_lineart, 8K;16K; Hdr, Blue Lips, Slim Eyebrows; Fair_skin:2, Long Two-Toned Dark_blue Hair, Realistic_character_anatomy, High Quality, Highest_quality; Extremely_detailed, Adult_woman:2; Mature_woman:2, Realistic Details, Painterly Texture, Cute;Kawaii, Digital_painting:2, Thick Thighs; Slim Waist, High Contrast, Painterly Details, Long Blue Hair; Blue Eyes, Dramatic; Epic; Emotional
Etiquetas de ropa: Hyperdetailed_eyelashes, High_contrast:2; Shadows:2; Light:2, Realistic:2; Anime:2, Canvas_tone_texture; Hyperdetailed, Hyperdetailed_skin:2, Expressive;Hyperrealistic:2, Hyperdetailed_body:2; Cute:2, Glow_diffusion; Saturated_colors:2, Hyperdetailed_shading, Hyperdetailed_textures:2, Hyperdetailed_hair, Glowing_eyes:2; Big_eyes:2, Hyperdetailed_clothing:2, Hyperdetailed_eyes:2, Art Bloom; Soft; Hard; Hairstrands, Painterly_skin_softness; Kawaii:2;, Soft Light; Thick Thighs; Matte_skin:2, Realistic Anime; Soft Shading
Fondo: Glowing Highlights, Detailed Rendering, Vibrant Colors, Saturated Colors, Ambient Lighting, Anime Art Style, Cell Shading, Rim Lighting, Digital Painting, Semi-Realistic, Soft Shading, Smooth Gradients, Dramatic Lighting, Polished Finish, Professional Artwork, Clean Lineart, High Contrast, Artstation Quality; Highest Quality
Desglosando parte de los físicos:
- Painterly - Más detalles pintados
- Soft - Imagen más suave
- No_lineart - Sin line-art (etiqueta tipo negativa)
- 8k; 16k / High Quality - Muy alta calidad deseada
- Hdr - Contraste más profundo entre luces y sombras
- Blue lips - El personaje tiene labios azules
- Fair_skin:2 - Realmente quiero piel clara
- Long Two-Toned Dark_blue Hair - Cabello largo con dos tonos de azul
- Realistic_character_anatomy - Anatomía realista
Anatomía de un prompt avanzado
¡Es hora de usar todo nuestro conocimiento recién adquirido para ser más creativos con nuestros prompts! Para esto usaremos el Fondo y Ropa de PaintFuka.
Aquí hay una comparación entre prompts no estilizados y uno estilizado:
| No estilizado | Estilizado |
|---|---|
![]() | ![]() |
Primero describamos una imagen que queremos crear:
- Cantidad de personas: 1
- Perspectiva: cowboy shot (perspectiva desde las rodillas hacia arriba)
- Personaje vistiendo un vestido de verano blanco
- Personaje está corriendo mientras extiende una mano
- Expresión: Sonriendo
- Fondo: No importante, puede ser borroso para hacer destacar al personaje
- Calidad: Extremadamente detallada, ilustración realista
Tomando esta lista en cuenta, preparemos todos los loras, scheduler, y palabras clave.
¡Porque queremos que la imagen se asemeje a una ilustración realista detallada, usemos LoRAs justo para eso!
Aquí está el resultado de aplicar los LoRAs Micro / Fine details :6 y Realistic Illustration :6:
| Con LoRAs | Sin LoRAs |
|---|---|
![]() | ![]() |
¡Ahora pongámosle ropa y hagámosla correr!
Prompt final:
Configuraciones avanzadas:
- LoRA: Micro / Fine details :6, Realistic Illustration :6
- Prompt Strength: 11.0
- CLIP Skip: 2
- Scheduler: DPM++ 2M
- Image Orientation: Landscape
- Seed: Random
- Prompt: Portrait
- Background: PaintFuka
- Clothes: PaintFuka
- Image Prompt:
(solo, alone)+++, (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++, (close, cowboy_shot)++++, (white_summer_dress---)2, (running)+++, (reaching_out, one_hand, outstretched_hand)+++, (smiling, Happy, open_mouth, closed_eyes)+, (blurry_background--)2
Resultado final:
Ahora analicemos qué entró en el prompt y cómo funciona:
(solo, alone)+++- hace que el personaje aparezca solo en la imagen(macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++- estos le dicen a la IA sobre la calidad de la imagen que queremos obtener(close, cowboy_shot)++++- Esto le dice a la IA que queremos un cowboy shot realmente cercano(white_summer_dress---)2- Esto fuerza a la IA a darle a nuestro personaje un vestido de verano blanco(running)+++- Esto le dice a la IA que queremos que nuestro personaje esté corriendo(reaching_out, one_hand, outstretched_hand)+++- Esto le dice precisamente a la IA qué tipo de pose queremos(smiling, Happy, open_mouth, closed_eyes)+- Esto define la expresión de nuestro personaje(blurry_background--)2- Esto fuerza a la IA a darnos un fondo borroso
Como extra, este es el efecto de agregar solo un LoRA más:
Problemas comunes
El problema más común es la degradación de calidad - algunos usuarios llaman a esto "carpetización" porque las imágenes rotas se ven como primeros planos de superficie de alfombra.
Esto es muy probablemente debido a:
- Demasiado peso
- Demasiada fuerza en los LoRAs
- Etiquetas en conflicto
Inpainting
Nuestro sitio web ofrece edición de imágenes asistida por IA. Esta es una función experimental que cuesta almas debido al gasto de recursos.
Para editar una imagen:
- Ve a la galería del personaje
- Elige la imagen a editar
- Presiona el botón EDIT IMAGE
A diferencia de la generación de imágenes, el inpainting usa prompts descriptivos. Explícale a la IA lo que quieres en oraciones comprensibles.
Ejemplo: "Cambia el cabello del personaje a blanco y la piel a negro"
El resultado:


