ネイティブリップシンク — 編集不要
Kling 3.0 Omni は1回の生成で音声と口の動きを同期させます。手動のキーフレーム設定や後編集は一切不要です。
顔写真と音声をアップロードするだけ — Kling 3.0 Omni が自動でリップシンク動画を生成します。
Renoise Canvas に顔写真と音声トラックをアップロードし、パフォーマンスを説明するプロンプトを入力して Kling 3.0 Omni でレンダリングするだけです。ネイティブリップシンク機能が音声と口の動きを1ステップで同期させます。実在する公人・有名人の肖像を使用する場合は、書面による同意を取得した上で FacePass の審査を完了させる必要があります。
歌うのではなく、スクリプトを話す写真を作りたい場合は AI トーキングフォトガイド
Kling 3.0 Omni のネイティブリップシンク — 始める前に知っておくべき重要事項。
Kling 3.0 Omni は1回の生成で音声と口の動きを同期させます。手動のキーフレーム設定や後編集は一切不要です。
1回の生成で3〜15秒のクリップを作成できます。Canvas タイムラインで複数クリップをつなげれば、長尺のパフォーマンス動画も制作できます。
音声トラックでも音楽ファイルでも対応しています。Kling 3.0 Omni が音素を読み取り、両方の口の形を正確に再現します。
公人・有名人を含む実在する人物の肖像を使用する場合は、書面による同意を取得した上で FacePass の審査を完了させてください。
顔写真と音声から、同期したパフォーマンス動画まで — すべて Renoise Canvas の中で完結します。ここではオリジナルのフィクションキャラクターでデモンストレーションします。

正面を向いた顔写真と音声トラックを Canvas にドラッグ&ドロップします。実在する人物の場合は、事前に FacePass の審査を完了させてください。

場面の設定、感情、スタイルを説明します — 例:「ネオンのステージに立つシンガー、エネルギッシュなポップパフォーマンス、ワイドショット」

モデルメニューから Kling 3.0 Omni を選択します。リップシンクはネイティブ対応です。生成後、同期済みクリップをエクスポートします。
Renoise で作成したオリジナルフィクションキャラクターのサンプルです。同じパイプラインで、許可を得た任意の顔と音声にも対応しています。
ネオン照明のステージで音楽に合わせて歌うオリジナル3Dシンガーキャラクター
クリームのジャケットを着たオリジナルフィクションプレゼンターがスタジオでスピーチを届ける
キッチンで口の動きを同期させながらナレーションするオリジナルフィクションシェフキャラクター
炎が揺れる幻想的な雰囲気の中でセリフを届けるオリジナルダークファンタジー戦士キャラクター
リップシンクとは、音声を口の形に対応させる技術です。話し言葉や歌声に含まれる個々の音(音素)には、それぞれ対応する口の形(ビジーム)があります。Kuaishou が開発した Kling 3.0 Omni は、アップロードされた音声をフレームごとに読み取り、その音素に合わせて顎・唇・頬を動かします。これにより、顔写真と音声から1ステップで同期された話し声・歌声の動画が生成されます。手動アニメーションや後処理は不要です。
参照する顔写真がアイデンティティのアンカーになります。モデルはクリップ全体を通じて顔の同一性を保ちながら、口の動きと表情だけを変化させます。静止した肖像写真が歌うシンガーや話すプレゼンターになれるのはこのためです — 顔は変わらず、口と表情だけが動きます。
フィクションキャラクター、イラストのアバター、AI 生成の顔に対しては、このパイプラインに追加手順はありません。しかし実在する識別可能な人物 — 公人、パフォーマー、その他誰であれ — については、Renoise は生成前に FacePass の審査を必須としています。FacePass とは肖像使用承認システムです。そのAI生成動画にその顔を使用する権利または書面による同意を保持していることを記録します。FacePass の審査が完了していない場合、モデルは実在する人物の顔をデフォルトでブロックします。
つまり、写真をアップロードするだけで実在するセレブのリップシンク動画を Renoise で生成することはできません。それには FacePass が必要であり、FacePass にはその本人の書面による同意が必要です。一方、自分自身の顔、自分が代理する同意済みの被写体、または完全にオリジナルのフィクションキャラクターであれば生成できます。このページのデモ例はすべて、パイプラインを示すためにオリジナルのフィクションキャラクターを使用しています。
本人の書面による同意なしには使用できません。Renoise の FacePass システムは、公人・有名人を含む実在する識別可能な人物すべてについて肖像使用の承認を必須としています。審査が完了していない場合、モデルは実在する人物の顔をデフォルトでブロックします。自分自身の顔、自分が代理する同意済みの被写体、または完全にオリジナルのフィクションキャラクターであれば FacePass なしで使用できます。
Kling 3.0 Omni は標準的な音声トラックに対応しています。話し声の録音でも音楽ファイルでも使用できます。Renoise Canvas で顔写真と一緒に音声ファイルを添付してください。モデルは言語を問わず、また音声が話し声か歌かにかかわらず音素を読み取ります。
Kling 3.0 Omni の1回の生成で3〜15秒のクリップが作成されます。フルコーラスや数分のモノローグなど、より長いパフォーマンスが必要な場合は複数のクリップを生成し、Canvas タイムラインでつなぎ合わせてください。
最良の結果を得るには、明るくて正面を向いた顔写真が適しています。顔が明瞭で遮るものがなく、カメラにほぼ向いている状態が理想的です。横向きの角度、強い影、または一部が隠れた状態ではリップシンクの精度が下がります。モデルが口のアニメーションを固定するための顔のジオメトリが少なくなるためです。
違います。Renoise のリップシンクパイプラインは、同意に基づく AI 動画生成ツールであり、なりすましや詐欺目的のツールではありません。実在する人物の顔を使った生成には書面による明示的な同意を伴う FacePass の審査が必要であり、プラットフォームとして無断での本人なりすましを許可していません。
はい。フィクションまたは AI 生成の顔には FacePass 要件はありません。オリジナルキャラクターを生成し、その同じキャラクターをリップシンクの参照顔として使用できます。このページのすべてのデモ例はこのアプローチを使用しています — オリジナルのフィクションキャラクターのみです。
Kuaishou が開発した Kling 3.0 Omni が、Renoise でネイティブリップシンクを提供するモデルです。「ネイティブ」とは、リップシンクが生成パイプラインに組み込まれていることを意味します — 顔と音声を指定するだけで、別の処理ステップなしに同期済み動画が1回で生成されます。
パイプラインは同じです — どちらも Kling 3.0 Omni のネイティブリップシンクで、参照顔と音声を使用します。違いは意図にあります。トーキングフォトは通常、スクリプトを読み上げるプレゼンターやスピーカーを対象とし、有名人リップシンクはパフォーマンス・歌唱などエンターテインメント用途を指します。プレゼンター向けの使い方については AI トーキングフォトガイドをご覧ください。