【LTX 2 3】SI2Vが凄い!画像と音声で喋るリップシンク動画生成|ComfyUI

このチャンネルでは、ComfyUIを中心に、画像生成や動画生成、音楽生成に関する情報をわかりやすく発信しています。
今回は、指定した静止画像に入力した音声を喋らせる動画を生成する、リップシンクの方法について解説していきます。

【ワークフローに記載のない不要モデル(gemma_3_12B_it_fp4_mixed.safetensors)】
https://huggingface.co/Comfy-Org/ltx-2/blob/main/split_files/text_encoders/gemma_3_12B_it_fp4_mixed.safetensors

【Real-ESRGAN】
https://github.com/xinntao/Real-ESRGAN

powered by Auto Youtube Summarize

Xでフォローしよう

おすすめの記事