2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

这篇具有很好参考价值的文章主要介绍了2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. 简介

  • 如果我们想要克隆孙燕姿的声音,整体的思路很简单,首先找一些孙燕姿唱歌时没有伴奏的人声,然后把这个声音放到模型中进行训练拟合,让AI学习说话的这种声线风格,最后使用这个训练出来的模型进行推理和风格迁移,这样一首孙燕姿唱其他人歌曲的音频就制作出来了。

2. 资源合集

  • 原始项目:GitHub - voicepaw/so-vits-svc-fork: so-vits-svc fork with realtime support, improved interface and more features.
  • 懒人包:pan.baidu.com/s/12u LDyb5KSOfvjJ9LVwCIQ?pwd=g8n4
  • 炼丹百科全书

3. 准备数据集

  • 用于训练的音频数据集应该切分为10秒的音频,太长的话会爆显存
  • 数据集是越多越好,但一般情况下,如果想要得到一个比较好的训练效果的话,有200段10秒的片段应该就差不多了

3.1. 人声分离

  • 一般使用spleeter来完成这个工作
    GitHub boy1dr/SpleeterGui: Windows desktop front end for Spleeter AI source separation

3.2. 音频进行切片化处理

  • 使用[Audio Slicer](…/…/…/…/…/…/…/…/…/音频/音频切片/Audio Slicer.md)来完成这个工作
    github.com/openvpi/audio slicer

3.2.1.

3.3. 数据集存放格式要求

  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • 将所有数据集放到dataset_raw文件夹下
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

4. 训练

4.1. 启动web UI.bat

  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • 之后会自动弹出一个训练网页
  • 127.0.0.1:7860/
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • 训练的时候需要有一张支持cuda的N卡,显存要求6gb以上

4.2. 识别数据集

  • 点击训练选项卡中的识别数据集,
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • 就会自动识别到我们刚才放到dataset_raw文件夹下面的音频文件
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

4.3. 数据预处理

  • 这个数据预处理很简单,只需要点击这个按钮选项即可开始进行处理
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
    预处理完结束之后,检查一下是否有对应的报错信息。
  • 正常情况下,预处理结束之后,会生成非常长的一段过程信息,简单检查一下即可,如果没有报错的话,就证明这个预处理是成功的
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • 那么我们就可以把这个输出信息给清空,会方便接下来的操作显示
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

4.4. 设置训练超参数

  • 这里的超参数可以自行设置,也可以直接使用默认的参数
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

4.4.1. 选择模型分支

一共有两个分支,一个是v1,另一个是vec768-layer12,目前说来,应该是第二个分支效果更好,但是没有经过广泛验证。总体来说比较玄学,选择哪一个都可以

  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

  • 如果GPU显存不是特别大的话,把这个Batch Size设的小一点,6G显存就设置为4即可
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

  • 同时,为了减少显存占用,可以使用半精度进行训练
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

  • 检查训练分支以及说话人列表
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

  • 如果所有的参数都设置正确的话,点击这个写入配置文件,才可以让上面选项生效
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

4.5. 进行训练

  • 点这个训练按钮就可以开始训练了,训练过程中会弹出来一个黑色的命令行窗口,
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

  • 上面会有很多信息,其中我们主要关注这个reference_loss这个值是越低越好的,如果它的值可以在20以下的话,那么表示他的模型是相当不错的
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

  • 需要说明的是,这个训练是不会自动充值的,需要你自己根据损失值来判断是否已经训练合乎要求了

4.5.1. 关于显存的说明

这样的过程中,如果爆显存了,那么就把这个数据集的切片设的更短一点,每段都设成5秒应该就够了

  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • 如果这样显存依然不够用的话,那么可以去云端租借一张GPU卡片
    我这边使用的是6G显存Batch Size为1的时候占用了3个G的显存
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • Batch Size为2,占用显存为4590,
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • Batch Size为6,占用显存为5623
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • 训练完成后,模型会保存在logs文件夹下面
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

5. 推理

5.1. 加载模型

  • 训练完成后,回到推理的选项卡上面

5.1.1. 加载模型配置

如果是刚训练完,那么模型和配置文件的路径都是正确的。如果是从外部转移过来的的话,那么需要放到对应的位置才行

  • 这个配置文件的路径是为 G模型和Kmeans聚类模型:logs\44k;配置文件:configs,
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • 如果路径不是这个的话,是读取不到的
    模型参数选择
  • 这模型选择的是G打头的文件,后面的这个数字就是他的训练步数
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
  • 点完之后点击加载模型,稍等一会儿,这个模型就可以加载到自己的显卡上面了
  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

5.2. 上传音频进行推理

  • 加载完模型之后,上传一段去除了背景声的音频,之后点击这个音频转换
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

  • 推理完成后,点击这里进行试听

  • 2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

  • 如果确定是自己想要的效果的话,点击音频右边的三个点进行下载
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

  • 需要注意的是,这里是纯人声,并没有伴奏,之后可以把它导入到PR或者一些类似的处理软件中进行声音的合成
    2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌

  • 之后就可以导出来或者发布到其他平台上了

(img-L8NnbjCy-1683636718490)]文章来源地址https://www.toymoban.com/news/detail-452261.html

  • 需要注意的是,这里是纯人声,并没有伴奏,之后可以把它导入到PR或者一些类似的处理软件中进行声音的合成
    [外链图片转存中…(img-4E0VZD7i-1683636718490)]
  • 之后就可以导出来或者发布到其他平台上了

到了这里,关于2023.05.09-使用AI克隆孙燕姿的声音来进行唱歌的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 保姆级教程!教你打造自己的AI孙燕姿;全程使用AI工具设计一款桌游;搭建基于LLM的客服系统的实践 | ShowMeAI日报

    👀 日报周刊合集 | 🎡 生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 王咏刚,创新工场CTO,技术撰稿人,有数个知名出版作品。他结合自己在AI领域投资、深度孵化和创业的丰富经验,分享了自己对AI技术最新应用场景的思考。 第一部分围绕GPT等通用大语言模型,

    2024年02月06日
    浏览(56)
  • AI孙燕姿爆火背后:语音转换技术so-vits-svc

    AIGC的风最近终于吹到了语音生成领域。上面视频中\\\"孙燕姿\\\"翻唱周杰伦的《七里香》,该歌是AI歌唱,并非孙燕姿本人。背后核心技术来自声音转换,voice convertion,而不是之前我们讲过的声音克隆,voice clone。 语音转换,voice convertion,简称VC。简单来说,就是把一个人的声音

    2024年02月12日
    浏览(52)
  • 「AI 孙燕姿」翻唱华语乐坛歌曲爆红全网,AI 翻唱将带来哪些影响?是否会有版权等问题?

    在某视频平台上,“AI孙燕姿”成了新网红,它翻唱过周杰伦的《发如雪》、翻唱过郭顶的《水星记》、翻唱过赵雷的《我记得》,受到了网友的追捧,甚至有网友宣布“这是2023年最火的声音”。 网上除了AI孙燕姿,还有AI周杰伦、AI王心凌、AI披头士、AI德雷克,网友们乐此

    2024年02月03日
    浏览(74)
  • AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践,复刻《遥远的歌》,原唱晴子(Python3.10)

    忽如一夜春风来,亚洲天后孙燕姿独特而柔美的音色再度响彻华语乐坛,只不过这一次,不是因为她出了新专辑,而是人工智能AI技术对于孙燕姿音色的完美复刻,以大江灌浪之势对华语歌坛诸多经典作品进行了翻唱,还原度令人咋舌,如何做到的? 本次我们借助基于Python3.

    2024年02月03日
    浏览(54)
  • AI孙燕姿 ?AI东雪莲 !—— 本地部署DDSP-SVC一键包,智能音频切片,本地训练,模型推理,为你喜欢的角色训练AI语音模型小教程

    目录 感谢B站UP羽毛布团 演示视频 稻香——东雪莲 虚拟——东雪莲 反方向的钟——东雪莲 晴天+龙卷风——东雪莲 ZOOD——东雪莲 DDSP-SVC 3.0 (D3SP) 是什么? 下载资源: 解压整合包 准备数据集 智能音频切片  数据集准备 填写训练设置和超参数  开始训练 推理模型 羽毛布団

    2024年02月06日
    浏览(55)
  • 每周编辑精选|7×24h 的 AI 直播间来啦!一键使用 GPT-SoVITS 声音克隆教程上新

    📢📢 好消息!好消息!📺「超神经电视台」在 bilibili 上线啦~ 「超神经电视台」会「7×24h」不间断直播 AI 领域的实用课程与行业大会等, 每周我们会在文章结尾发布下周的节目预告哦! 点开看看: http://live.bilibili.com/26483094 悄悄说, 前段时间从 OpenAI 离职的技术大神 Ka

    2024年04月08日
    浏览(91)
  • 【2023/05/09】Scratch

     Hello!大家好,我是霜淮子,2023倒计时第4天。 The mighty desert is burning for the love of a blade of grass who shaks her head and laughs and flies away. 译文: 无垠的沙漠热烈追求一叶绿草的爱,她摇摇头笑着飞开了。 If you shed tears when you miss the sun,you also miss the stars. 译文: 如果你因失去了太阳

    2024年02月03日
    浏览(35)
  • [AI语音克隆] 5秒内克隆您的声音并生成任意语音内容

    随着人工智能技术的不断发展,语音克隆技术也得到了越来越多的关注和研究。目前,AI语音克隆技术已经可以实现让机器模拟出一个人的声音,甚至可以让机器模拟出一个人的语言习惯和表情。 然而,AI语音克隆技术仍然面临着许多难点和痛点。首先,现有的语音克隆技术

    2024年02月08日
    浏览(33)
  • 【2023-05-09】 设计模式(单例,工厂)

    单例模式 顾名思义,就是整个系统对外提供的实例有且只有一个 特点: ​ 1、单例类只有一个实例 ​ 2、必须是自己创建唯一实例 ​ 3、必须给所以对象提供这个实例 分类:一般分为饿汉式单例(直接实例化)和懒汉式单例(使用时才实例化) 饿汉式单例 懒汉式单例 同步

    2024年02月03日
    浏览(40)
  • 用Python实现AI声音克隆的原理和代码示例

    声音克隆是一种利用机器学习技术学习特定人说话的声音特征,并以此生成合成音频的技术,通常在语音合成和人机交互等领域有广泛的应用。下面是一个简单的Python实现示例: 1.数据收集 首先,需要从多个不同说话人的语音数据集中收集原始音频数据,并将其分为训练集和

    2024年02月12日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包