Persona verosímil
Parte de un retrato generado o de una referencia, y lleva ese aspecto al movimiento.

Crea una persona realista con IA y ponla frente a cámara, hablando y en movimiento.
Primero genera a la persona como imagen —describe su aspecto o elige un retrato— y luego convierte ese fotograma en vídeo con Kling 3.0 Omni o Seedance 2.0. Kling 3.0 Omni añade lipsync nativo para que el humano pueda hablar; Seedance 2.0 entrega movimiento con audio nativo. Si se trata de una persona real, primero autoriza su rostro con FacePass.
Esto es generación de vídeo, no un humanizador de texto con IA. Ver foto que habla con IA
Así se ve un vídeo de humano con IA en Renoise.
Parte de un retrato generado o de una referencia, y lleva ese aspecto al movimiento.
Kling 3.0 Omni añade lipsync nativo para que tu humano con IA presente y hable.
Clips de 3 a 15 s a 720p o 1080p: no un avatar estático, sino una persona que realmente se mueve.
FacePass autoriza un parecido que posees o para el que tienes consentimiento antes de que entre al vídeo.
De un retrato generado a una persona que se mueve y habla en pantalla.

Describe el humano que quieres y genera un retrato, eligiendo de 1K a 4K en el menú de resolución para un fotograma de origen nítido.

Abre el menú de modelos y elige Kling 3.0 Omni para un humano que habla, o Seedance 2.0 para movimiento cinematográfico con audio nativo.
Convierte el retrato en vídeo (image-to-video), añade una frase para el lipsync y luego une los clips en la Canvas Timeline para una pieza más larga.
Fotogramas de personas generadas en Renoise: los humanos digitales desde los que partes antes de enviar un fotograma a vídeo.

Un presentador en plano de cabeza hablando a cámara.

Un presentador desplazándose por una escena.

Lip-sync nativo en Kling 3.0 Omni.

Pon en escena a varias personas originales a la vez.
Ambos viven en el mismo Canvas de Renoise: elige según la toma. Kling 3.0 Omni para un humano que habla y multitoma; Seedance 2.0 para movimiento cinematográfico con audio nativo.
| Para vídeo de humano con IA | Kling 3.0 OmniRecommended | Seedance 2.0 |
|---|---|---|
| Ideal para | Presentador que habla, multitoma | Audio nativo, cinematográfico |
| Lipsync nativo | ✓ | — |
| Consistencia multisujeto | ✓ | Bueno |
| Funciona con FacePass | ✓ | ✓ |
| Duración del clip | 3–15 s (≤10 s con vídeo de referencia) | 4–15 s, además del modo Fast |
| Resolución | 720p / 1080p | 720p / 1080p |
En este terreno, "humano con IA" suele significar una de dos cosas. Un humano digital es una persona que generas desde cero —describes un rostro, una edad, un estilismo y una iluminación, obtienes un retrato fotorrealista y luego das vida a ese fotograma como vídeo—. Un avatar de IA es una cabeza parlante prefabricada sobre la que escribes el guion: más rápido, pero el rostro es una plantilla, no uno que tú creaste. Renoise se sitúa del lado del humano digital: tú generas la persona, así que el aspecto es tuyo y no el de un presentador de stock, y mantienes el control total del encuadre, el movimiento y la escena.
El flujo práctico es generar y luego animar. Empieza con un modelo de imagen para fijar la persona y la resolución (1K–4K), y luego convierte ese fotograma en vídeo (image-to-video) con un modelo de vídeo. Kling 3.0 Omni es la opción cuando el humano tiene que hablar —su lipsync nativo sincroniza una frase hablada con la boca— y mantiene la consistencia multisujeto entre cortes. Seedance 2.0 es la opción para movimiento cinematográfico con audio nativo cuando el humano se desplaza por una escena en lugar de dirigirse a cámara.
Cuando el humano es una persona real, la regla cambia. Un rostro real detectable se trata como un parecido que necesita autorización, así que debe pasar por FacePass —un rostro que posees o para el que tienes consentimiento por escrito— antes de poder entrar al vídeo. Un humano totalmente ficticio y generado no necesita autorización. Las figuras públicas, las celebridades y los menores nunca están permitidos.
El vídeo de humano con IA se apoya en unas pocas cosas: los modelos de vídeo, la autorización de identidad y el Canvas.
Lipsync nativo y consistencia multisujeto para que un humano pueda presentar a lo largo de varios cortes.
Vídeo con audio nativo y referencia multimodal desde un solo prompt, hasta 1080p.
Autoriza un parecido real que posees o para el que tienes consentimiento antes de que entre al vídeo.
Une clips de humanos en un vídeo de presentador más largo, con cortes y transiciones.
Un solo plan desbloquea FacePass, Kling 3.0 Omni, Seedance 2.0 y todos los demás modelos.

Crea una persona, añade lipsync y exporta sin marca de agua en los planes de pago.
Genera un retrato de la persona y luego conviértelo en vídeo (image-to-video) con Kling 3.0 Omni o Seedance 2.0. Kling 3.0 Omni añade lipsync nativo para que el humano pueda hablar; Seedance 2.0 entrega movimiento con audio nativo. Une los clips en la Canvas Timeline para una pieza más larga.
No. Esta página trata sobre generar personas realistas con IA en vídeo: un humano digital que puedes poner frente a cámara. No es un humanizador de texto con IA ni una herramienta para reescribir texto generado por IA. El "humano" aquí es una persona que generas y animas.
Solo un rostro que estés autorizado a usar: el tuyo, o uno con consentimiento por escrito. Los rostros reales deben pasar primero por FacePass, y los rostros reales detectables se bloquean hasta que se autorizan. Un humano totalmente ficticio y generado no necesita autorización. Las figuras públicas, las celebridades y los menores no están permitidos.
Kling 3.0 Omni cuando el humano necesita hablar —su lipsync nativo sincroniza el habla— o para consistencia multitoma. Seedance 2.0 para movimiento cinematográfico con audio nativo. Ambos funcionan con FacePass en el mismo Canvas, así que puedes cambiar según la toma.
Sí, con Kling 3.0 Omni. Su lipsync nativo sincroniza una frase hablada con la boca para que un presentador generado pueda decir un guion. Añade la frase al prompt y el modelo anima el rostro para que coincida con ella.
Los retratos fotorrealistas se mantienen bien, y referenciar la misma imagen de origen conserva el aspecto entre clips, pero la consistencia es un comportamiento fuerte del modelo, no una garantía, y los rostros aún pueden desviarse. Para un parecido real, la autorización de FacePass es algo aparte.
Los modelos de vídeo de Renoise generan a 720p o 1080p. El nivel 4K se aplica solo a los modelos de imagen que usas para el retrato de origen, no al vídeo en sí. Genera a 1080p para publicar en redes sociales o plataformas de formato corto.