Wav2Lip视频人脸口型同步（Win10）

10月前作者：莫扎特不唱摇篮曲分类：Toy博客阅读(39) 违法举报

这篇具有很好参考价值的文章主要介绍了Wav2Lip视频人脸口型同步（Win10）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

最近比较火的一个AI场景，就是用原声讲外语，嘴型同步，网上找了些资料，今天也跑起来了，推荐 Wav2Lip，官网地址：Github Wav2Lip

环境准备

Python3.6
ffmpeg
git clone https://github.com/Rudrabha/Wav2Lip.git
pip install -r requirements.txt
下载人脸检测模型，并放在路径 face_detection/detection/sfd/s3fd.pth
Wav2Lip模型下载，放到路径 checkpoints/wav2lip.pth

上述步骤中涉及到下载地址的，直接访问官网首页对应链接即可下载

安装异常排查

opencv 安装异常

将 requirements.txt 中的 opencv-contrib-python>=4.2.0.34 修改为 opencv-contrib-python==4.2.0.34

pytorch 1.1.0 安装异常

直接进 pytorch 官网，用官网的方法安装 https://pytorch.org/get-started/previous-versions/#v110

视频demo

直接用官方的视频demo，进入 https://bhaasha.iiit.ac.in/lipsync/ 这个地址，里面的三个视频可以直接下载使用

音频生成

推荐这个网站，很好用 https://www.text-to-speech.cn/

运行命令

python inference.py --checkpoint_path ./checkpoints/wav2lip.pth --face D:/Ekoz/Items/QiuBao/dictator_orig.mp4 --audio D:/Ekoz/Items/QiuBao/output.wav
最终合成的视频，在 results 目录下文章来源地址https://www.toymoban.com/news/detail-791399.html

到了这里，关于Wav2Lip视频人脸口型同步（Win10）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

基于Wav2Lip+GFPGAN的AI数字人视频（以AutoDL算力云平台部署为例）

目录前言一、AutoDL云算力平台简介二、在AutoDL云算力平台上部署Wav2Lip-GFPGAN代码 2.1、创建AutoDL云算力实例 2.2、将源码导入实例 2.3、远程AutoDL云服务 2.4、安装依赖 2.5、导入视频和音频目录文件 2.6、配置参数 2.7、学术资源加速 2.8、运行run.py 2.9、导出视频三、结论四、参

2024年02月12日
浏览(49)
stable-diffusion-webui安装Wav2Lip

常见错误 1.错误：Torch is not able to use GPU; add --skip-torch-cuda-test to COMMANDLINE_ARGS variable to disable this check 修改代码：删除三个地方：

2024年01月22日
浏览(38)
基于Wav2Lip+GFPGAN的高清版AI主播

继上一篇基于Wav2Lip的AI主播的内容之后很多小伙伴反应一个问题就是生成的AI人物并不是很清晰，尤其是放到编辑器里会出现明显的痕迹，因此这次带来的了 Wav2Lip+GFPGAN 高清版的内容，如果不太了解这个项目实做什么的可以来先看一下效果。该项目暂时没有中文介绍，我这

2024年01月20日
浏览(44)
AI数字人主播技术实现Wav2Lip【详细记录】

近期很多童鞋私信，想知道关于AI数字人主播的技术实现。现本篇就AI数字人虚拟主播的Wav2Lip技术进行实现与评测，后续还会有其他的相关技术实现与评测。本文主要实现图片说话（如下图的蒙娜丽莎）、视频融合语音（这里的核心都是人物口型与音频中的语音唇形同步）

2024年02月11日
浏览(40)
wav2lip：Accurately Lip-syncing Videos In The Wild

飞桨AI Studio - 人工智能学习与实训社区集开放数据、开源算法、免费算力三位一体，为开发者提供高效学习和开发环境、高价值高奖金竞赛项目，支撑高校老师轻松实现AI教学，并助力开发者学习交流，加速落地AI业务场景 https://aistudio.baidu.com/aistudio/education/group/info/16651 wav

2024年02月06日
浏览(51)
Wav2Lip：深度解析、实现与应用AI数字人语音驱动模型

Wav2Lip模型作为一种将音频波形转换为面部动画的深度学习技术的重要性。本文将深入探讨Wav2Lip模型的搭建原理、搭建流程以及应用场景，以期为读者提供更具技术深度的理解。一、Wav2Lip的搭建原理 Wav2Lip模型的搭建基于生成对抗网络（GAN）的原理。GAN由两个主要部分组成：

2024年03月09日
浏览(69)
AI虚拟主播数字人技术实现Wav2Lip【附完整版教程】及【效果评测】

前言建议直接阅读飞书文档： Docs https://yv2c3kamh3y.feishu.cn/docx/S5AldFeZUoMpU5x8JAuctgPsnfg 近期很多饱子私信，想知道关于AI数字人主播的技术实现。现本篇就AI数字人虚拟主播的Wav2Lip技术进行实现与评测，后续还会有其他的相关技术实现与评测。本文主要实现图片说话（如下图的

2024年02月09日
浏览(40)
超写实虚拟数字人再升级：Wav2Lip-GFPGAN完整版教程及效果视频评测【手把手】

在前面的一篇数字人文章中，我们介绍了AI主播虚拟人技术中的一项重要技术——Wav2Lip，并附上了完整版教程和效果评测，具体可见AI数字人虚拟主播技术实现Wav2Lip及效果演示评测【附完整版教程】。然而，我们也发现了一个问题，生成的视频中面部的画质相对模糊，缺乏细

2024年02月16日
浏览(55)
基于 Wav2Lip-GFPGAN 深度学习模型的数字人Demo

工作中遇到简单整理博文为 Wav2Lip-GFPGAN 环境搭建运行的 Demo 理解不足小伙伴帮忙指正对每个人而言，真正的职责只有一个：找到自我。然后在心中坚守其一生，全心全意，永不停息。所有其它的路都是不完整的，是人的逃避方式，是对大众理想的懦弱回归，是随波逐流，是

2024年02月08日
浏览(66)
AI数字人：语音驱动面部模型及超分辨率重建Wav2Lip-HD

数字人打造中语音驱动人脸和超分辨率重建两种必备的模型，它们被用于实现数字人的语音和图像方面的功能。通过Wav2Lip-HD项目可以快速使用这两种模型，完成高清数字人形象的打造。项目代码地址：github地址 1.1 语音驱动面部模型wav2lip 语音驱动人脸技术主要是通过语音信

2024年02月16日
浏览(46)