代码地址:https://github.com/Rudrabha/Wav2Lip
我用的python版本是3.10
1. 安装ffmpeg
windows:https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z解压后bin目录添加到环境变量。
Ubuntu:apt-get install ffmpeg
2. 安装依赖
pip install -r requirements.txt
直接安装,使用cpu处理音视频文件,处理速度较慢
或者(有显卡的)删除requirements.txt里面的torch、torchvision,从https://pytorch.org/get-started/locally下载gpu版本
执行命令
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
3. 下载人脸切割处理模型
下载https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth放入Wav2Lip-master\face_detection\detection\sfd目录并且重命名为s3fd.pth
4. 下载权重模型
点此下载权重文件放入项目根目录
5. 准备一张人物照片或者人物视频(人脸清晰),一个音频(视频)文件
python inference.py --checkpoint_path wav2lip_gan.pth --face video.mp4 --audio audio.mp3
结果在results文件夹中
文章来源:https://www.toymoban.com/news/detail-657302.html
6. 看效果
图片效果:
文章来源地址https://www.toymoban.com/news/detail-657302.html
视频效果(视频经过其他处理):
到了这里,关于让照片开口讲话,让视频人物对口型的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!