最新嘴型融合模型SadTalker

这篇具有很好参考价值的文章主要介绍了最新嘴型融合模型SadTalker。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

环境

  • windows 10 64bit

  • SadTalker

  • torch 1.12.1+cu113

安装配置

创建一个全新的 python 虚拟环境

conda create -n sadtalker python=3.8
conda activate sadtalker

然后,拉取源代码,并且安装对应的依赖

git clone https://github.com/Winfredy/SadTalker.git
cd SadTalker

# 安装gpu版的torch
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113

# 安装dlib-bin,它比dlib更快
pip install dlib-bin

# 安装其它依赖
pip install -r requirements.txt 

# 安装gfpgan,如果不使用gfpgan增强,可以不安装
git clone https://github.com/TencentARC/GFPGAN.git gfpgan_src
cd gfpgan_src
python setup.py install

测试

找一段音频 test.mp3 和视频 test.mp4,进行测试

python.exe .\inference.py --driven_audio test.mp3 --source_image test.mp4 --result_dir outputs --enhancer RestoreFormer

其中,--source_image 参数可以是视频,也可以是图片, --result_dir 参数指定最后合成后的视频存放位置,--enhancer 指定视频增强的方法,可以是 gpfgan 或是 RestoreFormer

如果你的显卡够好,可以调整 --batch_size 参数,默认值是2,值越大,处理的越快。

还有部分参数,可以根据自己的实际情况添加。

FAQ

Traceback (most recent call last):
  File ".\inference.py", line 110, in <module>
    main(args)
  File ".\inference.py", line 71, in main
    batch = get_data(first_coeff_path, audio_path, device)
  File "D:\BaiduNetdiskDownload\SadTalker\SadTalker\generate_batch.py", line 68, in get_data
    orig_mel = audio.melspectrogram(wav).T
  File "D:\BaiduNetdiskDownload\SadTalker\SadTalker\utils\audio.py", line 47, in melspectrogram
    S = _amp_to_db(_linear_to_mel(np.abs(D))) - hp.ref_level_db
  File "D:\BaiduNetdiskDownload\SadTalker\SadTalker\utils\audio.py", line 95, in _linear_to_mel
    _mel_basis = _build_mel_basis()
  File "D:\BaiduNetdiskDownload\SadTalker\SadTalker\utils\audio.py", line 100, in _build_mel_basis
    return librosa.filters.mel(hp.sample_rate, hp.n_fft, n_mels=hp.num_mels,
TypeError: mel() takes 0 positional arguments but 2 positional arguments (and 3 keyword-only arguments) were given

这是由于 librosa 的版本高了,按照 requirements.txt,安装 0.6.0 版本即可

参考资料

  • https://github.com/Winfredy/SadTalker文章来源地址https://www.toymoban.com/news/detail-493081.html

到了这里,关于最新嘴型融合模型SadTalker的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Photoshop Elements2023(64bit)

    Photoshop Elements2023 链接:https://pan.baidu.com/s/1Gvra_dIgVF16jI4w428BDw  提取码:8888    Adobe Photoshop Elements是Adobe公司是继Photoshop之后全新推出的图像编辑、照片修饰和 Web 图形解决方案。它界面友好,易于使用,功能强大。 1,具有简单而快捷的操作方式、直观的效果预览、图像智能

    2024年02月08日
    浏览(39)
  • Linux Ubuntu 和 Mac ,Windows 部署离线通义千问1.8B参数 4-bit量化大模型详细教程 全网唯一

     代码为我自己写的 python 程序,应该是全网最简单的大模型部署方案,一个模型文件1.3GB,一个python代码即可开始玩耍~ 首先说明,本文下面的内容需要一点点python基础,需要会安装 python和 pip 安装依赖库,如果你不会或者不想这么麻烦,只想要下载就能马上使用的大模型

    2024年01月24日
    浏览(32)
  • Python 最新版本 3.12.1 环境配置(windows)

    python 3.12.1 百度网盘地址:https://pan.baidu.com/s/1SAcH_uH0T3DiERn6AZeQlg?pwd=4242 提取码:4242 首先我们需要进入 python 官方网站:https://www.python.org/ 点击网站上方选项栏中的 Download选项 点击黄色方块,下载 python 最新版本3.12.1 【备注】:下载速度可能会很慢,有梯子的话使用梯子访问,

    2024年02月20日
    浏览(43)
  • Chrome 108版(64-bit 108.0.5359.125)网盘下载

    还在用Selenium的朋友们注意了,目前Chrome的最新版是116,而官方的Chromedriver只支持到115版。 可惜Google不提供旧版Chrome的下载方式,需要旧版的很难回去了。如果真的想要旧版的Chrome,只能民间自救。 我在2022年12月备份了C盘镜像,现在从中提取到Chrome 108.0.5359.125版的安装文件

    2024年02月09日
    浏览(62)
  • 【Java8 环境安装】Java1.8&JDK环境安装jdk-8u361-windows-x64

    一、JDK的下载 首先进入Oracle官网下载JDK1.8安装包 https://www.oracle.com/ 依次点击 Resources Java Downloads 选择版本,页面往下拉,这里我们选择1.8的版本,也就是Java8 选择Java8 Windows版本 点击下载,选择64位的版本(一般电脑都是64位,最好看一下电脑系统的版本) 需要注册账号,为

    2024年02月07日
    浏览(60)
  • “SRP模型+”多技术融合在生态环境脆弱性评价模型构建、时空格局演变分析与RSEI 指数的生态质量评价

    近年来,国内外学者在生态系统的敏感性、适应能力和潜在影响等方面开展了大量的生态脆弱性研究,他们普遍将生态脆弱性概念与农牧交错带、喀斯特地区、黄土高原区、流域、城市等相结合,评价不同类型研究区的生态脆弱特征,其研究内容主要包括脆弱性的时空演变、

    2024年02月12日
    浏览(45)
  • 如何在windows上本地部署SadTalker,实现AI数字人

    设备配置:CPU E3-1240v3, RAM 32G, SSD 1T, GPU0 Nvidia 1080ti,GPU1 Nvidia T4 OS:Windows10专业版 【python安装】 1、下载安装python 3.10.9 https://www.python.org/ftp/python/3.10.9/python-3.10.9-amd64.exe 2、下载安装git https://git-scm.com/downloads   3、下载解压ffmpeg 打开:https://github.com/GyanD/codexffmpeg/releases 下载:

    2024年02月16日
    浏览(36)
  • Docker 启动 elasticsearch报错OpenJDK 64-Bit Server VM warning:

    OpenJDK 64-Bit Server VM warning: Option UseConcMarkSweepGC was deprecated in version 9.0 and will likely be removed in a future release. 顶上的这段报错理论上不是报错, 就是一个 warning, 提醒你UseConcMarkSweepGC会在 v9.0 后弃用. 不是 Java 版本报错, 如果 java 版本不支持会在 logs 里面直接打出来的 不是 docker -d

    2024年02月11日
    浏览(75)
  • Windows下基于VSCode搭建C++开发环境(包含整合MinGW64、CMake的详细流程)

    最近想写写C++,装了VisualStudio 2022,折腾半天。对于一个用惯VSCode的人来说,总感觉IDE太笨重。于是自己网上各种查资料,自己琢磨,搭建了一套Windows下基于VSCode和CMake的C++轻量级开发环境。 1. 下载并安装VSCode VSCode下载地址(AzureCDN加速地址) 首先同意安装协议: 下一步,

    2024年02月15日
    浏览(65)
  • Windows环境下git客户端中的git-bash和MinGW64

    我们在 Windows10 操作系统下,安装了 git 客户端之后,可以通过 git-bash.exe 打开一个 shell: 执行一些 linux 系统里的命令: 注意到上图紫色的 MINGW64. Mingw-w64 是原始 mingw.org 项目的改进版,旨在支持 Windows 系统上的 GCC 编译器。 它在 2007 年对它进行了分叉,以提供对 64 位和新

    2024年02月15日
    浏览(57)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包