自定义角色设计
描述角色的美术风格、配色方案和服装,生成专属角色立绘。
设计风格化动漫角色人格,搭配原生口型同步让它开口说话。
在Canvas中用Nano Banana Pro生成风格化角色立绘,再通过Kling 3.0 Omni原生口型同步功能将其转为视频。输入一段台词,Kling 3.0 Omni就会让角色嘴型与音频精准匹配——几步操作即可得到一段会说话的VTuber人格短片。
只是想让已有照片动起来,而不是从头设计新角色? 查看AI会说话的照片教程
在Renoise中打造AI VTuber虚拟形象的完整体验。
描述角色的美术风格、配色方案和服装,生成专属角色立绘。
Kling 3.0 Omni驱动角色嘴型,与输入台词精准同步。
生成3–15秒会说话的角色片段,720p或1080p,适用于直播叠加层和短视频内容。
若以真实人脸作为形象底图,须先完成FacePass肖像授权审核。
从角色概念到会说话的动画人格。

在Canvas中描述VTuber的外观——美术风格、服装、发型、表情——使用Nano Banana Pro生成角色立绘。

在Canvas中从图像模式切换至视频模式,选择Kling 3.0 Omni,并将角色立绘作为参考帧上传。

填写VTuber要说的台词,开启口型同步,点击生成。输出即是一段简短的角色说话动画片段。
在Renoise中生成的风格化动画角色片段——多元美学,全部为原创虚构角色。

大眼睛、夸张发型——经典日式动漫VTuber美学。

铠甲、翅膀或魔法细节,打造奇幻主题的直播角色人格。

VTuber虚拟形象对镜说话,口型同步。

情绪化肢体动作短片,适合用作直播叠加层的精彩瞬间。
大多数VTuber使用虚构角色——无需授权审核。若想以真实面貌为基础打造形象,则须先完成FacePass审核。
| 形象类型 | 虚构/生成角色Recommended | 通过FacePass的真实人脸 |
|---|---|---|
| 设计来源 | 从提示词全新生成 | 上传肖像,经FacePass审核授权 |
| 是否需要授权 | 不需要 | 需要FacePass白名单审核 |
| 口型同步(Kling 3.0 Omni) | ✓ | ✓ |
| 迭代速度 | 随时重新提示生成 | 每次修改需重新提交 |
| 适用人群 | 所有人 | 肖像本人或授权持有者 |
VTuber是一种虚拟主播人格:一个风格化的动画角色,代替创作者出镜直播或制作短视频,让他们无需露出真实面孔。这个角色本身就是品牌——有固定外形、名字和美学风格——而不仅仅是一个功能性工具。
Renoise通过生成式AI来实现这一点:你在提示词中描述角色人格(风格、配色、服装、表情),将角色生成为图像,再通过Kling 3.0 Omni将其驱动为动画。原生口型同步功能是让它成为真正VTuber(而非普通静态图)的关键——输入台词,角色嘴型就会动起来与之匹配,让你无需绑定或动作捕捉软件,即可输出短内容片段。
因为角色完全是虚构且由AI生成,不存在肖像权顾虑。FacePass适用的场景是:有人希望以自己的真实外貌为基础打造形象——比如用自己的照片作为风格化前的参考帧。这属于真实人脸,因此必须在进入视频生成流程前通过FacePass白名单审核。对于大多数VTuber需求——从文字提示创造全新角色——工作流程是直接的,形象身份也完全属于你自己。
如果只是想让已有图片的照片说话,而不是设计新角色,可以参考会说话的照片教程,流程有所不同。
VTuber虚拟形象创作依次使用图像模型、Kling口型同步和Canvas。
生成最高4K分辨率的精细风格化立绘——基础形象帧。
根据台词驱动角色嘴型——原生支持,无需后期处理。
当形象以真实人脸为基础时,提供肖像授权审核。
图像与视频生成一体化工作台——生成、动画化、拼接一气呵成。
一个订阅方案,解锁Nano Banana Pro、Kling 3.0 Omni和Canvas,即可开始制作虚拟形象。
完全可以。在文字提示词中描述角色——美术风格、发型、服装、配色——Nano Banana Pro即可生成立绘。无需绘画、绑定或委托画师。再用Kling 3.0 Omni制作说话片段即可。
Kling 3.0 Omni原生口型同步以文字台词为输入,驱动角色嘴型与语音输出精准匹配。你可以单独录制自己的配音,再手动对齐到片段时间轴。口型同步生成本身是从台词到动画的过程,不是实时声音追踪。
AI虚拟形象生成是更宽泛的能力——创建任意类型的数字角色图像。AI VTuber是一个具体的使用场景:一个专为直播或短视频内容设计的风格化动画角色人格,其中说话头部动画和口型同步是核心输出。虚拟形象教程介绍的是通用创建方法;本教程专注于带动画效果的VTuber直播人格。
可以,但真实人脸属于肖像,需要授权审核。请将其上传至FacePass完成白名单审核。只有审核通过后,该肖像才能作为生成时的参考帧使用。FacePass以授权优先为原则,审核不保证通过。
视频片段生成为720p或1080p——适合各大短视频平台的标准规格。基础立绘可用图像模型生成最高4K分辨率,为动画化提供清晰的源帧。
完全可以——由于角色是生成图像,你随时可以重新提示并生成新版本。调整造型、更换服装、改变配色——每次变化就是一次新的Canvas提示词。无需重新绑定。