AI 语音 - 人物音色训练-Toy模板网

这篇具有很好参考价值的文章主要介绍了AI 语音 - 人物音色训练。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前情提要

2023-07-02 周日杭州阴晴不定

AI 入门三大项，AI 绘画基础学习，AI 语音合成，AI 智能对话训练，进入 AI 语音合成阶段了，搓搓小手很激动的，对于一个五音不全的我来说，这个简直了(摆脱了低级趣味，保留点好色就够了)；

** 时间线 **
a. 2021 年函数计算编程大赛；
b. 2022 年东数西算架构设计；
c. 2023 年人工智能创纪元；

实践手册

1. 安装 UVR_v5.5.0

2. 人声提取

2.a 混音分离

AI 语音 - 人物音色训练,人工智能,语音识别

2.b 干声提取

AI 语音 - 人物音色训练,人工智能,语音识别

2.c 提取自己声音

吐槽: bilibili 太不是人了，上传的视频居然不能下载，只能用其他工具才能搞下来，还好只是要用视频提取语音，浪费时间的行为真的烦。

B站视频解析: https://bilibili.iiilab.com/

** 准备自己的语音和视频资源 **
时长: 10-30min
片段: 3-10
备注: 没有去录音棚特意录制音频，最后的效果应该会差强人意吧，但是只能苦哈哈了，还好之前存了些视频资源，不然这次真的就难过了。

AI 语音 - 人物音色训练,人工智能,语音识别

2.d 音频切片

AI 语音 - 人物音色训练,人工智能,语音识别

备注: 音频文件重命名(同理 BAT)
AI 语音 - 人物音色训练,人工智能,语音识别

3. 人声训练

3.a 人声训练集

AI 语音 - 人物音色训练,人工智能,语音识别

3.b 启动 so-vits-svc

双击启动webui.bat

AI 语音 - 人物音色训练,人工智能,语音识别

3.c 数据预处理

AI 语音 - 人物音色训练,人工智能,语音识别

说明: 数据预处理的话，需要小心爆显存的问题，可以通过预测器的切换进行数据预处理，这个一般的配置也是 8G 显存起步才可以，否则的话，数据预处理就无法通过的；

AI 语音 - 人物音色训练,人工智能,语音识别

处理办法: 删除音频时间超过 20S 或者小于 10s 的音频，数据预处理完成以后继续下一步训练过程，正常结束应该如下图所示:

AI 语音 - 人物音色训练,人工智能,语音识别

3.d 音色训练

AI 语音 - 人物音色训练,人工智能,语音识别

说明: 训练过程需要持续 1-7d 左右，主要是因为自己的算力一般，也不能说电脑算力太差，只是 AI 就是吃算力的，还好训练好音色模型以后就可以往任何的歌曲上嵌套，因此音色训练的时间至少需要持续1周左右，此过程电脑最好不要关闭，及时关闭，训练也要基于上次进行；

4. 训练监控

打开监控面板:

AI 语音 - 人物音色训练,人工智能,语音识别

总结

太多坑了，一不小心就会栽进去的，这东西没办法高谈阔论的，必须事必躬亲，不过一般完整走一遍流程基本就掌握了，我现在还没有那么想熟悉代码，gpu 碎片回收机制，代码优化还有很多可以做的，不过这次倒不急，及也急不来的。对于学习人工智能的小朋友们，虽说研究生阶段一般实验室会配备算力设备并且可以报销，但是自己的电脑性能最好还是要跟上才可以的，AI 真的不是穷人的游戏，配置在2万左右的游戏本也不过是入门级别的配置，不过该花的钱还是要花的，不然设备差一个级别，那么你可能落后别人一年甚至数年。少拿天赋说事，不在同一个环境你连参与竞争的机会都没有的。

附录

开源 mp3 下载地址: https://tonzhon.com/playlists/6442733bc6d7bdf6d5155629
视频转音频: https://www.aigei.com/tool/video/audio
音频转换: https://app.xunjieshipin.com/mp3-to-wav/
B站解码器: https://bilibili.iiilab.com/文章来源地址https://www.toymoban.com/news/detail-523650.html

到了这里，关于AI 语音 - 人物音色训练的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！