AI声音克隆模型常见问题汇总笔记(附解决方法,可评论区留言问题技术交流

这篇具有很好参考价值的文章主要介绍了AI声音克隆模型常见问题汇总笔记(附解决方法,可评论区留言问题技术交流。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

AI声音克隆模型常见问题汇总-学习笔记(附解决方法

声明:
源码非原创,转载自小破站UP主Jack-Cui,文章部分内容来源网路,本文只用于技术分享,模型训练与语音输出已测试成功。

硬件配置工具及运行环境

CPU: i5-12490F
显卡:七彩虹战斧 RTX 4060 显存8G  # 网传:A卡不行
内存:16G
运行系统:Windows 10
Python版本:3.10.9
Python旧版本下载链接:https://www.python.org/downloads/windows/

名词解释:

batch_size:计算效率和内存容量之间的平衡参数。若为高性能GPU,可以设置更大的batch_size值
epochs:所有样本训练一遍。一个epoch是所有训练样本的一轮正向传递和一轮反向传递。
举例:假设训练数据集总共有1000个数据集,batch_size=10,样本集需要100次迭代,完成1次epoch。


*问题汇总(附解决方法

Part 1: 训练几小时报错。

解决方法:比如设置了epoch为50,结果训练很久后报错,可以看cmd的日志,是不是最后一条训练Epoch为50或者51.这种报错是模型训练已经完成。直接关闭,启动 预测一键启动.bat 即可


Part 2:CUDA相关报错

final_annotation_train.txt,人工智能,笔记,python,ai,机器学习
解决方法:这种一般是爆显存,建议是音频做下切片,每个wav不超过2分钟,batch_size调小一下。


Part 3: Error Connection errored out.

final_annotation_train.txt,人工智能,笔记,python,ai,机器学习
解决方法:打开报错:Error Connection errored out. 建议检查下代理服务器有没有关掉,以及墙/VN/魔法上网,有没有关闭。


Part 4: 找不到系统指定路径问题

解决方法:一般这个是权限不够,直接双击,或者用管理员身份打开。如果是预测一键启动.bat打不开,也有可能是模型没有训练成功。


Part 5:开始运行后提示:音频文件识别失败

解决方法:这个是训练填写的路径错误,路径不要包含中文,建议是直接在工程文件里面找到VITS_fast_finetune\raw_audio直接复制粘贴过去


Part 6:页面文件太小,无法完成操作

解决方法:这个需要修改下虚拟内存。建议改大一点。具体教程可以百度搜索
大概步骤:高级系统设置–点上边高级–性能里面点设置–再点性能选项中高级–出来有个虚拟内存更改按钮–点击进去设置(根据自己硬件条件设置,比如D盘256G 我设置100G虚拟内存


Part 7:bat 文件乱码

解决方法:不要使用win11默认的解压软件,解压压缩包,请使用WinRAR解压。

解压工具分享链接:https://pan.baidu.com/s/10QEYoeNoUem9hCkWzzQpaw
提取码:9996


Part 8: ProcessExitedException 报错 code 3221225477

process 0 terminated with exit code 3221225477
final_annotation_train.txt,人工智能,笔记,python,ai,机器学习
解决方法:报错原因是音频通过脚本生成对应的text文本中,句子太长。简而言之还是爆显存
个人解决方法:将wav文件做下前期处理,通过剪映将长句子的片段裁剪掉
Up主解决方法:https://www.bilibili.com/video/BV13z4y1L74i/ 视频4分钟后就有讲解该问题。


Part 9:训练没有进度条,空跑项目

final_annotation_train.txt,人工智能,笔记,python,ai,机器学习
解决方法:检查音频raw_audio文件夹有没有放到VITS_fast_finetune 工程目录下


Part 10:运行后网页打不开

final_annotation_train.txt,人工智能,笔记,python,ai,机器学习
解决方法:打开 finetune_webui.py 文件,修改最后两行代码,8088 改为 8089 或者其他端口。


Part 11:multiprocessing.spawn.ProcessExitedException: process 0 terminated with exit code 1

final_annotation_train.txt,人工智能,笔记,python,ai,机器学习
解决方法:这种异常报错,直接打开 finetune_webui.py 文件,找到587行,将gr.Slider中第二个参数改成 10000,重新运行代码,在网页端选择epochs时,调高点。

max_epochs = gr.Slider(2, 10000, value = 200, label = "训练epochs次数", info = "迭代训练的轮次,默认200")

Part 12:路径没错,点开始训练完全没反应,也没打印流程

final_annotation_train.txt,人工智能,笔记,python,ai,机器学习
解决方法:检查,检查,检查路径中的音频文件后缀是不是小写wav,文件后缀必须为小写!小写!小写的wav


Part 13: UnicodeEncodeError: ‘gbk‘ codec can‘t encode character(编码问题

解决方法:更新一下 pip,

更新指令:pip install --upgrade pip
然后win+R 输入cmd,输入
set PYTHONUTF8=1


Part 14:关于预测一键启动.bat 运行失败问题

解决方法:检查路径中是否含有中文,需要先运行训练一键启动.bat,训练好模型之后,关掉训练一键启动.bat,只运行预测一键启动.bat,模型是不能分享,必须自己训练。


Part 15:关于重新训练模型

解决方法:分别删除以下 目录 里面的文件

denoised_audio
custom_character_voice
separated
segmented_character_voice
OUTPUT_MODEL

然后删除工程目录下的 txt 文件

final_annotation_train.txt
final_annotation_val.txt

另外:如果想继续之前训练一般的模型,OUTPUT_MODEL目录的文件不用删除,仅删除上面所述的其他文件。重新运行代码即可


Part 16:(待更新,可以在评论区留言…

有待更新…


个人使用总结:

1.音频文件尽量是5分钟内
2.效果与预期可能有点差距,只能到百分之80-90的效果
3.训练的时间需要很长。建议先设置epochs=50试一下,是不是自己想要的效果,不满意建议就换音源节省时间,个人测试后epochs=900与epochs=50 只是音质完善一下。
4.训练模型中,最好使用干声作为数据源
5.使用工具链接分享

哔哩哔哩视频解析下载:https://bilibili.iiilab.com/
在线视频提取音频:https://airmore.cn/extract-audio-online
在线转换音频文件:https://www.aconvert.com/cn/audio/文章来源地址https://www.toymoban.com/news/detail-790496.html


创作不易,麻烦点个赞!感谢支持!!

创作不易,麻烦点个赞!感谢支持!!

创作不易,麻烦点个赞!感谢支持!!

到了这里,关于AI声音克隆模型常见问题汇总笔记(附解决方法,可评论区留言问题技术交流的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 软件平台接口常见问题汇总

    接口常见问题汇总 一、接口技术层面 1、输入参数验证校验不全面。如:      1.1入参数据类型长度边界,范围边界。      1.2 入参数据内容、成员内容,有效无效,合法非法。      1.3 入参数据 特殊字符 敏感字符过滤。      1.4 入参可否必选。 2、接口内部触发的服务相

    2023年04月21日
    浏览(14)
  • 大数据常见面试问题汇总

    目录 第1章 核心技术 1.1 LinuxShell 1.1.1 Linux常用高级命令 1.1.2 Shell常用工具及写过的脚本 1.1.3 Shell中单引号和双引号区别 1.2 Hadoop 1.2.1 Hadoop常用端口号 1.2.2 HDFS读流程和写流程 1.2.3 HDFS小文件处理 1.2.4 HDFS的NameNode内存 1.2.5 Shuffle及优化 1.2.6 Yarn工作机制 1.2.7 Yarn调度器 1.2.8 HDFS块大

    2024年02月14日
    浏览(11)
  • 毕业设计答辩常见问题汇总

    答:P0口做数据总线用是不需要加上拉电阻,这个书上面有写的,就是8个IO口同时控制输出,比如P0口接1602液晶、12864液晶、数码管的8段段选等等都不需要加上拉电阻,如果做单个的IO口用就要加上拉电阻。 答:这个论文中有的,也都是一些套话。我就不答了,我整理的都是

    2024年02月05日
    浏览(8)
  • oracle 19c环境常见问题汇总

    1、rman备份时会消耗这么多临时表空间 参考MOS: RMAN-08132: Warning: Cannot Update Recovery Area ORA-01652: unable to extend temp segment by 64 in tablespace TEMP (Doc ID 2658437.1) Known RMAN Performance Problems (Doc ID 247611.1) 处理办法:备份时,会话级别将optimizer_mode由ALL_ROWS改成RULE RMAN sql \\\"alter session set optimi

    2024年02月12日
    浏览(12)
  • FPGA/IC面试常见问题汇总

    FPGA/IC面试常见问题汇总

    参考:数字IC设计工程师笔试面试经典100题_OnePlusZero的博客-CSDN博客_数字ic设计面试题 目录 参考:数字IC设计工程师笔试面试经典100题_OnePlusZero的博客-CSDN博客_数字ic设计面试题 1、同步复位和异步复位的优缺点 2、什么是竞争和冒险,如何消除? 3、什么是同步电路,什么是异

    2024年02月11日
    浏览(9)
  • RecycleView基本使用及常见问题汇总

    RecycleView属于android基础组件,比较常用,下面总结下其使用的基础流程及常见问题解决办法(常见问题会定期更新) 基础使用 首先在xml里引入RecycleView 编写adapter,分以下几步 1.创建自定义adapter类,创建内部类MyViewHolder,并实现RecycleView的ViewHolder,参数传递view 创建item layout,里

    2024年01月16日
    浏览(15)
  • 性能测试工具LR常见问题汇总

    本文是收集整理LR常见的问题,如果你有收集整理常见的问题 本文意义:让所有使用LR的同学,在此处能找到LR日常碰到问题的解决方案。 1 )如果安装 了IE以外的浏览器,并且IE不是默认浏览器,则无法生成录制脚本 2 )如果录制脚本时IE 不能打开,则需要将浏览器的IE工具

    2024年02月10日
    浏览(8)
  • CAN协议详解+常见问题汇总,吐血整理!!!

    CAN协议详解+常见问题汇总,吐血整理!!!

    文章分两部分,一是CAN的详解,二是常见问题汇总;文章长,但是都是重点精华,往有帮助~ (参考的是火哥的STM32有关CAN协议的文档) 一、CAN的详解 1. 物理层 CAN总线:成为汽车计算机控制系统和嵌入式工业控制局域网的标准总线。 CAN是异步通讯,只有CAN_High和CAN_Low两条信

    2024年02月08日
    浏览(7)
  • Docker常见问题/面试题汇总和解析

    Docker是一种开源容器平台,可以通过轻量级容器来实现应用程序的打包、发布和部署。 虚拟机使用虚拟化技术来在操作系统上运行多个独立的操作系统。而容器只需要一个共享的操作系统内核即可运行多个隔离的用户空间实例。 Docker 主要由三个组件组成:客户端(Docker Cl

    2024年02月16日
    浏览(21)
  • 阿里云国际版账号注册常见问题汇总

    公司现与阿里云国际站达成战略合作,为客户提供高品质、高性能、高可用的阿里云产品与服务,助力客户用云服务创造更多价值,达成业务转型、加速和创新,全面提升业务竞争力。助企业在各种业务场景中充分利用混合云基础设施进行优化。 以顾客为中心,服务范围跨越

    2024年02月14日
    浏览(12)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包