
このチャンネルでは、ComfyUIを中心に、画像生成や動画生成、音楽生成に関する情報をわかりやすく発信しています。
今回は、指定した静止画像に入力した音声を喋らせる動画を生成する、リップシンクの方法について解説していきます。
【ワークフローに記載のない不要モデル(gemma_3_12B_it_fp4_mixed.safetensors)】
https://huggingface.co/Comfy-Org/ltx-2/blob/main/split_files/text_encoders/gemma_3_12B_it_fp4_mixed.safetensors
【Real-ESRGAN】
https://github.com/xinntao/Real-ESRGAN
powered by Auto Youtube Summarize

