#1 do ranking
#1 em T2V (Elo 1333) e #1 em I2V (Elo 1392) no Artificial Analysis, abril de 2026.
Da Alibaba ATH, dentro do Renoise. Narrativas multiplano de 15 segundos com áudio nativo, superando toda a concorrência.
#1 em T2V (Elo 1333) e #1 em I2V (Elo 1392) no Artificial Analysis, abril de 2026.
Até 15 segundos de narrativa multiplano — o suficiente para contar uma história completa.
Diálogos e efeitos sonoros gerados junto com o vídeo — com lip-sync nativo em 7 idiomas.
1080p nativo a 30 FPS — qualidade profissional sem precisar de upscaling extra.

Descreva a cena em texto ou envie uma imagem como quadro inicial.

Se quiser, envie até 9 imagens de referência e cite-as no seu prompt como character1, character2, etc.

Escolha o HappyHorse, clique em Generate e receba um clipe em 1080p com áudio nativo.
Com texto puro, ele roda T2V; envie uma imagem de primeiro quadro e ele muda para I2V automaticamente. A mesma interface, o mesmo fluxo de trabalho — os dois modos sem trocar de modelo.
Diálogos, efeitos sonoros e ambiência são gerados junto com o vídeo em uma única passagem — com lip-sync nativo em 7 idiomas, incluindo cantonês, inglês, francês e coreano.
Envie até 9 imagens de referência e use character1 / character2 no seu prompt — o modelo funde a aparência de cada personagem e a mantém consistente em toda a cena.
Gere até 15 segundos de vídeo coerente com vários cortes de plano em uma única passagem — movimento natural, trabalho de câmera fluido e consistência temporal estável.
Desbloqueie o HappyHorse 1.0 e todos os outros modelos com um único plano do Renoise.
O HappyHorse 1.0 é desenvolvido pela equipe ATH da Alibaba. O Renoise o integra junto com Seedance 2.0, Kling 3.0 Omni, Nano Banana 2 / Pro, GPT Image 2 e Midjourney V7 — o Renoise não treina modelos de vídeo por conta própria.
O HappyHorse ocupa o #1 em text-to-video (Elo 1333) e o #1 em image-to-video (Elo 1392) no Artificial Analysis, em abril de 2026.
Sim. Com texto puro, ele roda T2V; envie uma imagem de primeiro quadro e ele muda para I2V automaticamente — uma única interface, sem trocar de modelo.
Sim. Diálogos, efeitos sonoros e ambiência são gerados junto com o vídeo em uma única passagem, com lip-sync nativo em 7 idiomas, incluindo cantonês, inglês, francês e coreano — sem dublagem à parte.
Até 15 segundos de narrativa multiplano em 1080p nativo a 30 FPS, com suporte a até 9 imagens de referência de personagens.
Abra o Renoise, digite um prompt ou envie uma referência e clique em Generate.