排名第一
截至 2026 年 4 月,在 Artificial Analysis 上 T2V(Elo 1333)与 I2V(Elo 1392)双双第一。
由 Alibaba ATH 出品,内置于 Renoise。15 秒多镜头叙事配原生音频,性能全面领先同类。
截至 2026 年 4 月,在 Artificial Analysis 上 T2V(Elo 1333)与 I2V(Elo 1392)双双第一。
最长 15 秒的多镜头叙事——足以讲完一个完整的故事。
对白与音效随视频一并生成——支持 7 种语言的原生对口型。
原生 1080p、30 FPS——无需额外放大即可达到专业级画质。

用文字描述画面,或上传一张图片作为起始帧。

可选择上传最多 9 张参考图片,并在提示词中以 character1、character2 等方式引用。

选择 HappyHorse,点击 Generate,即可获得带原生音频的 1080p 视频。
纯文字时执行 T2V;上传首帧图片便自动切换到 I2V。同一界面、同一工作流——无需切换模型即可使用两种模式。
对白、音效与环境声在一次生成中与视频同步产出——支持粤语、英语、法语、韩语等 7 种语言的原生对口型。
上传最多 9 张参考图片,并在提示词中使用 character1 / character2——模型会融合每个角色的外观,并在整个画面中保持一致。
一次生成最长 15 秒、含多个镜头切换的连贯视频——动作自然、运镜流畅、时序稳定一致。
一个 Renoise 套餐,即可解锁 HappyHorse 1.0 及其它所有模型。
HappyHorse 1.0 由 Alibaba 的 ATH 团队开发。Renoise 将其与 Seedance 2.0、Kling 3.0 Omni、Nano Banana 2 / Pro、GPT Image 2 和 Midjourney V7 一同集成——Renoise 自身并不训练视频模型。
截至 2026 年 4 月,在 Artificial Analysis 上 HappyHorse 在 text-to-video(Elo 1333)和 image-to-video(Elo 1392)两项中均排名第一。
支持。纯文字时执行 T2V;上传首帧图片便自动切换到 I2V——同一界面,无需切换模型。
会。对白、音效与环境声在一次生成中与视频同步产出,支持粤语、英语、法语、韩语等 7 种语言的原生对口型——无需另行配音。
最长 15 秒的多镜头叙事,原生 1080p、30 FPS,并支持最多 9 张角色参考图片。