Guía
Cómo mantener un personaje de IA consistente entre escenas
Genera el mismo personaje dos veces y casi siempre obtendrás dos personas distintas. La cara cambia, el pelo varía de largo, la chaqueta cambia de color, porque la mayoría de los modelos de imagen y video con IA construyen cada generación desde cero a partir del prompt, sin recuerdo de lo que hicieron la última vez. Para una toma suelta, eso da igual. Pero para una historia, un anuncio o una serie tipo influencer donde el mismo personaje tiene que aparecer en varias escenas, esa deriva es justo el problema. La buena noticia: los modelos recientes mantienen un personaje mucho más estable que antes, y Renoise te da varias técnicas concretas para llevar la consistencia más lejos. La advertencia honesta de entrada: esto es una mejora a nivel de modelo, no una garantía. Seedance 2.0 y Kling 3.0 Omni todavía se desvían a veces, así que el flujo consiste en inclinar la balanza a tu favor, no en pulsar un interruptor.
Por qué los personajes de IA se desvían
Cada generación toma una muestra de un enorme espacio de imágenes plausibles. Cuando tu prompt dice "una mujer joven de pelo corto y oscuro", el modelo es libre de elegir una mujer joven de pelo corto y oscuro, no la de tu última toma. Pequeñas diferencias en la semilla aleatoria, en la redacción del prompt, en el ángulo de cámara o en la iluminación empujan el resultado hacia una cara ligeramente distinta. A lo largo de diez generaciones esos empujones se acumulan, y al final tu personaje es un primo lejano del que tenías al empezar.
La solución es darle al modelo algo fijo en lo que anclarse: una referencia, un fotograma arrastrado, un storyboard o un lenguaje estable, para que tenga menos libertad de divagar. Ninguna de estas opciones fuerza un bloqueo perfecto, pero cada una reduce el rango del que el modelo extrae.
Técnica 1: fija un set de imágenes de referencia
El ancla más fuerte es un set de imágenes de referencia de tu personaje. En lugar de describir la cara con palabras y cruzar los dedos, le entregas al modelo fotos reales y le dices: haz que la nueva toma se parezca a esta persona.
Ambos modelos de video disponibles en Renoise aceptan varias referencias:
| Modelo | Imágenes de referencia | Notas |
|---|---|---|
| Seedance 2.0 (ByteDance) | Hasta 9 imágenes | También acepta primer/último fotograma y continuación |
| Kling 3.0 Omni (Kuaishou) | Hasta 7 imágenes (≤4 con un video de referencia) | Consistencia multipersonaje, hasta 6 tomas por storyboard |
Más referencias suele significar un anclaje más firme, porque el modelo ve al personaje desde varios ángulos y expresiones y promedia hacia una identidad estable en vez de adivinar a partir de una sola foto. Un set práctico: una cara frontal nítida, un ángulo de tres cuartos, un plano de cuerpo entero para el vestuario y las proporciones, y un par de expresiones. Mantén la iluminación y el estilo consistentes en todo el set para anclar al personaje, no un estado de ánimo concreto.
Si todavía no tienes personaje, genera uno primero: elige tu mejor resultado y luego reintroduce esa imagen (más variaciones de ella) como set de referencia para cada toma siguiente. La guía de personajes de IA te explica cómo construir uno desde cero.
Técnica 2: primer/último fotograma y continuación para arrastrar un look entre tomas
Las imágenes de referencia anclan quién es el personaje; el primer/último fotograma y la continuación anclan cómo se conecta una toma con la siguiente.
Seedance 2.0 admite ambos. Con el primer/último fotograma, aportas el fotograma de apertura (y opcionalmente el de cierre) de un clip, y el modelo genera el movimiento intermedio, de modo que el personaje empieza la toma exactamente igual que el fotograma fijo que le pasaste. Con la continuación, extiendes a partir de un clip existente, retomando donde terminó el último. Encadenados, permiten que un personaje arrastre un look a lo largo de una secuencia: el fotograma final de la toma uno se convierte en el primer fotograma de la toma dos, y así sucesivamente, en lugar de que cada clip empiece desde cero.
Esto es especialmente útil cuando un prompt de texto a video puro no deja de desviarse: fijar un fotograma de inicio explícito le quita al modelo mucho margen para reinventar la cara.
Técnica 3: arma varias tomas en un solo trabajo
Generar las tomas de una en una invita a la deriva, porque cada trabajo es independiente. Kling 3.0 Omni ofrece una opción más firme: hasta 6 tomas en un único trabajo de storyboard, más consistencia multipersonaje dentro de una toma.
Describir varias tomas juntas hace que el modelo las trate como una sola secuencia coherente: el mismo personaje y escenario arrastrados entre cortes, en lugar de seis conjeturas separadas que coses después. La consistencia multipersonaje extiende esto a escenas con más de un personaje: dos personas en un diálogo, o un presentador junto a un producto recurrente, manteniendo cada uno su apariencia a lo largo del clip. Como capacidad a nivel de modelo, esto es mucho más firme de lo que lograban los modelos antiguos, pero aún puede desviarse, así que revisa la salida en lugar de dar por hecho un calce perfecto. La guía de influencers de IA cubre cómo construir así un personaje recurrente frente a cámara.
Técnica 4: mantén constante el lenguaje de tu prompt
La técnica más barata no cuesta nada: deja de reformular a tu personaje. Cada vez que vuelves a describir a la misma persona de otra manera, le entregas al modelo una nueva interpretación hacia la cual desviarse.
- Escribe un bloque de personaje fijo: una descripción corta y exacta de cara, pelo, complexión y vestuario distintivo, y pega el mismo texto en cada prompt. Cambia solo la escena, la acción y la cámara a su alrededor.
- Sé específico, no poético. "Mandíbula cuadrada, pelo negro al rape, gafas estrechas de montura de acero, chaqueta de campo verde oliva" ancla mejor que "un tipo rudo".
- No pelees contra tus referencias con palabras. Si tu set de referencia muestra pelo largo, no escribas también "pelo corto": las señales contradictorias son una fuente común de deriva.
- Mantén también estable el lenguaje de estilo. Fija el estilo de render ("fotorrealista, 50 mm, luz de día suave") entre tomas para que el personaje no quede reiluminado con un look distinto cada vez.
Un lenguaje estable más un set de referencia estable es la combinación que hace casi todo el trabajo.
Una nota sobre personas reales
Todo lo anterior trata sobre la consistencia de personajes: diseños que tú creas. Poner en pantalla la imagen de una persona real es otra cosa, con un paso de consentimiento. En Renoise eso pasa por una revisión de imagen única para caras reales autorizadas: confirmas que tienes los derechos sobre esa persona antes de generar. Es una compuerta de cumplimiento, no una función creativa, y está separada de las técnicas de consistencia de personajes de aquí: esas mantienen estable a un personaje inventado; la revisión de imagen rige si tienes permiso para representar a un individuo real. No mezcles las dos cosas.