AI 有名人リップシンク動画

顔写真と音声をアップロードするだけ — Kling 3.0 Omni が自動でリップシンク動画を生成します。

AI 有名人リップシンク動画はどうやって作るの？

Renoise Canvas に顔写真と音声トラックをアップロードし、パフォーマンスを説明するプロンプトを入力して Kling 3.0 Omni でレンダリングするだけです。ネイティブリップシンク機能が音声と口の動きを1ステップで同期させます。実在する公人・有名人の肖像を使用する場合は、書面による同意を取得した上で FacePass の審査を完了させる必要があります。

歌うのではなく、スクリプトを話す写真を作りたい場合は AI トーキングフォトガイド

リップシンクジェネレーターの主な特徴

Kling 3.0 Omni のネイティブリップシンク — 始める前に知っておくべき重要事項。

ネイティブリップシンク — 編集不要

Kling 3.0 Omni は1回の生成で音声と口の動きを同期させます。手動のキーフレーム設定や後編集は一切不要です。

3〜15秒のクリップ

1回の生成で3〜15秒のクリップを作成できます。Canvas タイムラインで複数クリップをつなげれば、長尺のパフォーマンス動画も制作できます。

音声：話し声と音楽どちらも対応

音声トラックでも音楽ファイルでも対応しています。Kling 3.0 Omni が音素を読み取り、両方の口の形を正確に再現します。

実在する人物には FacePass 同意確認が必要

公人・有名人を含む実在する人物の肖像を使用する場合は、書面による同意を取得した上で FacePass の審査を完了させてください。

3ステップでリップシンク動画を作成

顔写真と音声から、同期したパフォーマンス動画まで — すべて Renoise Canvas の中で完結します。ここではオリジナルのフィクションキャラクターでデモンストレーションします。

Step 1
顔写真と音声をアップロード
正面を向いた顔写真と音声トラックを Canvas にドラッグ＆ドロップします。実在する人物の場合は、事前に FacePass の審査を完了させてください。
Step 2
パフォーマンスのプロンプトを入力
場面の設定、感情、スタイルを説明します — 例：「ネオンのステージに立つシンガー、エネルギッシュなポップパフォーマンス、ワイドショット」
Step 3
Kling 3.0 Omni を選択して生成
モデルメニューから Kling 3.0 Omni を選択します。リップシンクはネイティブ対応です。生成後、同期済みクリップをエクスポートします。

リップシンクのパフォーマンススタイル例

Renoise で作成したオリジナルフィクションキャラクターのサンプルです。同じパイプラインで、許可を得た任意の顔と音声にも対応しています。

ステージパフォーマンス

ネオン照明のステージで音楽に合わせて歌うオリジナル3Dシンガーキャラクター

スタジオプレゼンター

クリームのジャケットを着たオリジナルフィクションプレゼンターがスタジオでスピーチを届ける

シェフのナレーション

キッチンで口の動きを同期させながらナレーションするオリジナルフィクションシェフキャラクター

ファンタジーモノローグ

炎が揺れる幻想的な雰囲気の中でセリフを届けるオリジナルダークファンタジー戦士キャラクター

AI リップシンクの仕組みと、実在する顔に FacePass が必要な理由

リップシンクとは、音声を口の形に対応させる技術です。話し言葉や歌声に含まれる個々の音（音素）には、それぞれ対応する口の形（ビジーム）があります。Kuaishou が開発した Kling 3.0 Omni は、アップロードされた音声をフレームごとに読み取り、その音素に合わせて顎・唇・頬を動かします。これにより、顔写真と音声から1ステップで同期された話し声・歌声の動画が生成されます。手動アニメーションや後処理は不要です。

参照する顔写真がアイデンティティのアンカーになります。モデルはクリップ全体を通じて顔の同一性を保ちながら、口の動きと表情だけを変化させます。静止した肖像写真が歌うシンガーや話すプレゼンターになれるのはこのためです — 顔は変わらず、口と表情だけが動きます。

フィクションキャラクター、イラストのアバター、AI 生成の顔に対しては、このパイプラインに追加手順はありません。しかし実在する識別可能な人物 — 公人、パフォーマー、その他誰であれ — については、Renoise は生成前に FacePass の審査を必須としています。FacePass とは肖像使用承認システムです。そのAI生成動画にその顔を使用する権利または書面による同意を保持していることを記録します。FacePass の審査が完了していない場合、モデルは実在する人物の顔をデフォルトでブロックします。

つまり、写真をアップロードするだけで実在するセレブのリップシンク動画を Renoise で生成することはできません。それには FacePass が必要であり、FacePass にはその本人の書面による同意が必要です。一方、自分自身の顔、自分が代理する同意済みの被写体、または完全にオリジナルのフィクションキャラクターであれば生成できます。このページのデモ例はすべて、パイプラインを示すためにオリジナルのフィクションキャラクターを使用しています。

最初のリップシンク動画を作成しましょう

有料プランではウォーターマークなしでエクスポートできます。

今すぐ生成 FacePass を見る

よくある質問

1.実在する有名人の顔をリップシンクに使えますか？

本人の書面による同意なしには使用できません。Renoise の FacePass システムは、公人・有名人を含む実在する識別可能な人物すべてについて肖像使用の承認を必須としています。審査が完了していない場合、モデルは実在する人物の顔をデフォルトでブロックします。自分自身の顔、自分が代理する同意済みの被写体、または完全にオリジナルのフィクションキャラクターであれば FacePass なしで使用できます。

2.リップシンクに使える音声フォーマットは？

Kling 3.0 Omni は標準的な音声トラックに対応しています。話し声の録音でも音楽ファイルでも使用できます。Renoise Canvas で顔写真と一緒に音声ファイルを添付してください。モデルは言語を問わず、また音声が話し声か歌かにかかわらず音素を読み取ります。

3.リップシンク動画はどのくらいの長さにできますか？

Kling 3.0 Omni の1回の生成で3〜15秒のクリップが作成されます。フルコーラスや数分のモノローグなど、より長いパフォーマンスが必要な場合は複数のクリップを生成し、Canvas タイムラインでつなぎ合わせてください。

4.参照写真の顔は完全に正面を向いている必要がありますか？

最良の結果を得るには、明るくて正面を向いた顔写真が適しています。顔が明瞭で遮るものがなく、カメラにほぼ向いている状態が理想的です。横向きの角度、強い影、または一部が隠れた状態ではリップシンクの精度が下がります。モデルが口のアニメーションを固定するための顔のジオメトリが少なくなるためです。

5.これはいわゆるディープフェイクと同じですか？

違います。Renoise のリップシンクパイプラインは、同意に基づく AI 動画生成ツールであり、なりすましや詐欺目的のツールではありません。実在する人物の顔を使った生成には書面による明示的な同意を伴う FacePass の審査が必要であり、プラットフォームとして無断での本人なりすましを許可していません。

6.実際の写真の代わりに AI 生成の顔を使えますか？

はい。フィクションまたは AI 生成の顔には FacePass 要件はありません。オリジナルキャラクターを生成し、その同じキャラクターをリップシンクの参照顔として使用できます。このページのすべてのデモ例はこのアプローチを使用しています — オリジナルのフィクションキャラクターのみです。

7.Renoise でリップシンクを担当するモデルはどれですか？

Kuaishou が開発した Kling 3.0 Omni が、Renoise でネイティブリップシンクを提供するモデルです。「ネイティブ」とは、リップシンクが生成パイプラインに組み込まれていることを意味します — 顔と音声を指定するだけで、別の処理ステップなしに同期済み動画が1回で生成されます。

8.リップシンクとトーキングフォトの違いは何ですか？

パイプラインは同じです — どちらも Kling 3.0 Omni のネイティブリップシンクで、参照顔と音声を使用します。違いは意図にあります。トーキングフォトは通常、スクリプトを読み上げるプレゼンターやスピーカーを対象とし、有名人リップシンクはパフォーマンス・歌唱などエンターテインメント用途を指します。プレゼンター向けの使い方については AI トーキングフォトガイドをご覧ください。