Logo de Soulkyn AI

Generación avanzada de imágenes

Esta guía asume que ya conoces los conceptos básicos de generación de imágenes. La información de la guía básica no se explicará de nuevo.

Nuestro sitio usa SDXL (Stable Diffusion eXtra Large) como base. Los pesos han sido simplificados y las sintaxis mayormente deshabilitadas para la comodidad del usuario.

Esta guía cubre: Configuraciones avanzadas (LoRA, scheduler, prompt strength, CLIP skip), pesos, estilización, presets, e inpainting.

Configuración avanzada

Advanced settings panel

Capas

Las capas son "bloques" que componen un modelo de imagen. Piensa en Stable Diffusion como una torre hecha de pisos - cada "bloque" tiene su propio trabajo:

  • Capas tempranas - Capturan detalles de bajo nivel (bordes, colores, texturas)
  • Capas medias - Capturan patrones y formas (caras, ropa, estructura corporal)
  • Capas tardías - Capturan significado semántico (conceptos como "gato" vs "perro" o "estilo anime" vs "foto")

LoRA

Los LoRAs son métodos de entrenamiento para ajustar modelos grandes. Cuando tienes un modelo de imagen, los LoRAs le enseñan nuevos trucos inyectándose en ciertas capas - como remodelar pisos específicos en la torre.

CLIP Skip Layers

Stable Diffusion usa CLIP (Contrastive Language-Image Pre-training) como codificador de texto para convertir tu prompt en embeddings. CLIP es básicamente un traductor entre tú y el modelo de imagen. Saltar capas corta la comprensión de alto nivel.

Muchos modelos anime y LoRAs están entrenados con valores de CLIP skip en mente (más frecuentemente 2). Saltar una capa podría darte resultados más tipo anime o estilizados.

Scheduler

El scheduler controla el proceso de denoising durante la generación. Afecta fuertemente la nitidez de la imagen, coherencia, y adherencia al prompt.

Euler a - Fast

  • Produce imágenes nítidas y detalladas con fuerte contraste
  • Excelente para anime, arte estilizado, o detalles tipo boceto
  • A veces inestable con realismo - puede distorsionar texturas finas o caras
  • Cuándo usar: Resultados rápidos, creativos y detallados para estilo anime o arte conceptual
Euler a example

DPM++ SDE Karras

  • Produce gradientes suaves de alta calidad y transiciones suaves
  • Excelente para detalles más pequeños
  • Cada renderizado sale diferente - bueno para variación orgánica
  • Cuándo usar: Renderizados fotorrealistas, iluminación natural, estilos pictóricos, transiciones suaves
DPM++ SDE Karras example

DPM++ 2M - Deterministic

  • Produce resultados suaves y consistentes con alta fidelidad al prompt
  • Buen balance entre velocidad y precisión
  • Cuándo usar: Realismo, retratos, estilos consistentes donde la estabilidad importa
DPM++ 2M example

DPM++ 2M Karras

  • Produce gradientes más suaves, mejor textura, y mayor fidelidad de detalle que el DPM++ 2M vanilla
  • Ligeramente más lento que Euler A, pero mayor calidad para realismo
  • Cuándo usar: Imágenes fotorrealistas, retratos, texturas complejas - mejor para apariencia pulida y estable
DPM++ 2M Karras example

Prompt Strength

Prompt strength cambia la escala CFG - cuanto mayor el valor, más el sistema sigue tu prompt de imagen.

  • CFG Bajo (1-5): El modelo presta menos atención al prompt. Más libertad artística, composiciones más oníricas. Riesgo: La imagen se desvía de lo que pediste.
  • CFG Medio (6-9): Adherencia balanceada vs creatividad. Punto dulce común: 7-8. Mantiene tanto precisión como estética.
  • CFG Alto (10+): Fuerte adherencia a palabras clave. Puede volverse sobresaturado, áspero, o "quemado". Riesgo: Artefactos extraños, imágenes rígidas o no naturales.

Pesos

El peso real de + es 1.1^x (donde x = número de +). Mientras tanto - es 0.9^x.

# de signosPeso de -Peso de +
10.91.1
20.811.21
30.7291.331
40.65611.4641
50.590491.61051
60.5314411.771561

ADVERTENCIA: ¡ESTA TABLA NO ES UNA TABLA MATEMÁTICA! ¡ES UNA REPRESENTACIÓN VISUAL DEL RESULTADO FINAL!

Puedes engañar al sistema: (keyword-)2 da el equivalente de (keyword)1.8. Más complejo: (keyword---)2 se calcula como (keyword 0.9^3)2 = 0.729 * 2 = (keyword)1.458

Estilización

Las combinaciones de palabras clave y pesos pueden lograr ciertas apariencias deseadas. Ejemplo con painterly_shading:

Con Painterly_shading+++Sin
Painterly shading exampleWithout stylization

Puedes cambiar:

  • Estilo / Estilización - Apariencia general
  • Sombreado / Iluminación - Volumen y profundidad
  • Line-art - Definición de bordes
  • Proporciones - Cómo se representan los sujetos
  • Textura / Detalle - Detalles de superficie
  • Composición / Encuadre - Arreglo
  • Simulación - Qué medio simula la imagen
  • Calidad - Calidad general

Preajustes y físicos

¡Los prompts de imagen tienen solo 550 caracteres! Puedes evitar esto usando presets de fondo, ropa, y físicos para prompts más estilizados.

Reglas de presets en Soulkyn: 32 caracteres, 18 etiquetas.

Trucos:

  • Usa punto y coma ; para empaquetar múltiples significados en una etiqueta
  • Usa guiones bajos _ para precisar el significado para la IA
  • Usa :2 para aplicar un peso más fuerte (normalizado para prevenir explosión)

Ejemplo: Personaje PaintFuka

Etiquetas físicas: Painterly; Soft; No_lineart, 8K;16K; Hdr, Blue Lips, Slim Eyebrows; Fair_skin:2, Long Two-Toned Dark_blue Hair, Realistic_character_anatomy, High Quality, Highest_quality; Extremely_detailed, Adult_woman:2; Mature_woman:2, Realistic Details, Painterly Texture, Cute;Kawaii, Digital_painting:2, Thick Thighs; Slim Waist, High Contrast, Painterly Details, Long Blue Hair; Blue Eyes, Dramatic; Epic; Emotional

Etiquetas de ropa: Hyperdetailed_eyelashes, High_contrast:2; Shadows:2; Light:2, Realistic:2; Anime:2, Canvas_tone_texture; Hyperdetailed, Hyperdetailed_skin:2, Expressive;Hyperrealistic:2, Hyperdetailed_body:2; Cute:2, Glow_diffusion; Saturated_colors:2, Hyperdetailed_shading, Hyperdetailed_textures:2, Hyperdetailed_hair, Glowing_eyes:2; Big_eyes:2, Hyperdetailed_clothing:2, Hyperdetailed_eyes:2, Art Bloom; Soft; Hard; Hairstrands, Painterly_skin_softness; Kawaii:2;, Soft Light; Thick Thighs; Matte_skin:2, Realistic Anime; Soft Shading

Fondo: Glowing Highlights, Detailed Rendering, Vibrant Colors, Saturated Colors, Ambient Lighting, Anime Art Style, Cell Shading, Rim Lighting, Digital Painting, Semi-Realistic, Soft Shading, Smooth Gradients, Dramatic Lighting, Polished Finish, Professional Artwork, Clean Lineart, High Contrast, Artstation Quality; Highest Quality

PaintFuka example

Desglosando parte de los físicos:

  • Painterly - Más detalles pintados
  • Soft - Imagen más suave
  • No_lineart - Sin line-art (etiqueta tipo negativa)
  • 8k; 16k / High Quality - Muy alta calidad deseada
  • Hdr - Contraste más profundo entre luces y sombras
  • Blue lips - El personaje tiene labios azules
  • Fair_skin:2 - Realmente quiero piel clara
  • Long Two-Toned Dark_blue Hair - Cabello largo con dos tonos de azul
  • Realistic_character_anatomy - Anatomía realista

Anatomía de un prompt avanzado

¡Es hora de usar todo nuestro conocimiento recién adquirido para ser más creativos con nuestros prompts! Para esto usaremos el Fondo y Ropa de PaintFuka.

Aquí hay una comparación entre prompts no estilizados y uno estilizado:

No estilizadoEstilizado
Not stylizedStylized

Primero describamos una imagen que queremos crear:

  • Cantidad de personas: 1
  • Perspectiva: cowboy shot (perspectiva desde las rodillas hacia arriba)
  • Personaje vistiendo un vestido de verano blanco
  • Personaje está corriendo mientras extiende una mano
  • Expresión: Sonriendo
  • Fondo: No importante, puede ser borroso para hacer destacar al personaje
  • Calidad: Extremadamente detallada, ilustración realista

Tomando esta lista en cuenta, preparemos todos los loras, scheduler, y palabras clave.

¡Porque queremos que la imagen se asemeje a una ilustración realista detallada, usemos LoRAs justo para eso!

Aquí está el resultado de aplicar los LoRAs Micro / Fine details :6 y Realistic Illustration :6:

Con LoRAsSin LoRAs
With LoRAsWithout LoRAs

¡Ahora pongámosle ropa y hagámosla correr!

Prompt final:

Configuraciones avanzadas:

  • LoRA: Micro / Fine details :6, Realistic Illustration :6
  • Prompt Strength: 11.0
  • CLIP Skip: 2
  • Scheduler: DPM++ 2M
  • Image Orientation: Landscape
  • Seed: Random
  • Prompt: Portrait
  • Background: PaintFuka
  • Clothes: PaintFuka
  • Image Prompt: (solo, alone)+++, (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++, (close, cowboy_shot)++++, (white_summer_dress---)2, (running)+++, (reaching_out, one_hand, outstretched_hand)+++, (smiling, Happy, open_mouth, closed_eyes)+, (blurry_background--)2

Resultado final:

Final result

Ahora analicemos qué entró en el prompt y cómo funciona:

  • (solo, alone)+++ - hace que el personaje aparezca solo en la imagen
  • (macro_detail, clean_composition, color_balance, 8k_realistic_render, professional_product_shot)+++ - estos le dicen a la IA sobre la calidad de la imagen que queremos obtener
  • (close, cowboy_shot)++++ - Esto le dice a la IA que queremos un cowboy shot realmente cercano
  • (white_summer_dress---)2 - Esto fuerza a la IA a darle a nuestro personaje un vestido de verano blanco
  • (running)+++ - Esto le dice a la IA que queremos que nuestro personaje esté corriendo
  • (reaching_out, one_hand, outstretched_hand)+++ - Esto le dice precisamente a la IA qué tipo de pose queremos
  • (smiling, Happy, open_mouth, closed_eyes)+ - Esto define la expresión de nuestro personaje
  • (blurry_background--)2 - Esto fuerza a la IA a darnos un fondo borroso

Como extra, este es el efecto de agregar solo un LoRA más:

Effect of adding one more LoRA

Problemas comunes

El problema más común es la degradación de calidad - algunos usuarios llaman a esto "carpetización" porque las imágenes rotas se ven como primeros planos de superficie de alfombra.

Esto es muy probablemente debido a:

  • Demasiado peso
  • Demasiada fuerza en los LoRAs
  • Etiquetas en conflicto

Inpainting

Nuestro sitio web ofrece edición de imágenes asistida por IA. Esta es una función experimental que cuesta almas debido al gasto de recursos.

Para editar una imagen:

  1. Ve a la galería del personaje
  2. Elige la imagen a editar
  3. Presiona el botón EDIT IMAGE
Inpainting UI

A diferencia de la generación de imágenes, el inpainting usa prompts descriptivos. Explícale a la IA lo que quieres en oraciones comprensibles.

Ejemplo: "Cambia el cabello del personaje a blanco y la piel a negro"

El resultado:

Inpainting result example