AI 人声模拟,MockingBird实现AI拟声,声音处理,基础搭建和采坑处理。

这篇具有很好参考价值的文章主要介绍了AI 人声模拟,MockingBird实现AI拟声,声音处理,基础搭建和采坑处理。。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

AI 人声模拟 MockingBird实现AI拟声 基础搭建和采坑处理。

1.下载项目

git@github.com:babysor/MockingBird.git

https://github.com/babysor/MockingBird.git

此项目分两个版本 请注意 一个是主版本 一个是V0.0.1版本

AI 人声模拟,MockingBird实现AI拟声,声音处理,基础搭建和采坑处理。

现在主要是演示v0.0.1版本

2.基础环境
  1. Anconada 安装 Anconada 安装

  2. 创建一个全新的conda环境 图像界面创建

    以下以python3.9版本开始配置,以下以创建新的conda环境名称MockingBird开始

  3. 安装pytorch

    官网 选择你电脑可以适配版本

AI 人声模拟,MockingBird实现AI拟声,声音处理,基础搭建和采坑处理。

  1. 安装安装 ffmpeg

AI 人声模拟,MockingBird实现AI拟声,声音处理,基础搭建和采坑处理。

下载地址

需要配置环境变量,使得cmd中能启动ffmpeg 配置地址

  1. 切换到你下载的git目录。执行 pip install -r requirements.txtAI 人声模拟,MockingBird实现AI拟声,声音处理,基础搭建和采坑处理。

问题

第一个

ERROR: Ignored the following versions that require a different python version: 0.52.0 Requires-Python >=3.6,<3.9; 0.52.0rc3 Requires-Python >=3.6,<3.9; 0.55.2 Requires-Python <3.5
ERROR: Could not find a version that satisfies the requirement monotonic-align==0.0.3 (from versions: 1.0.0)
ERROR: No matching distribution found for monotonic-align==0.0.3

解决方案:这种情况就是把 monotonic-align的版本直接改成1.0.0 即monotonic-align==1.0.0 即可

第二个

error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools": https://visualstudio.microsoft.com/visual-cpp-build-tools/ 

解决方案

  • 点击https://visualstudio.microsoft.com/visual-cpp-build-tools/ ,下载生成工具

  • 配置如下C++环境
    AI 人声模拟,MockingBird实现AI拟声,声音处理,基础搭建和采坑处理。

  • 重启电脑

  1. 最后执行 pip install webrtcvad-wheels 即可
2.下载模型

使用前一定要tag切换到v0.0.1版本

下载的模型保存到AI 人声模拟,MockingBird实现AI拟声,声音处理,基础搭建和采坑处理。

saved_models 这个文件夹需要自己创建

3. 启动

执行 python -u web.py

访问 http://localhost:8080 即可

AI 人声模拟,MockingBird实现AI拟声,声音处理,基础搭建和采坑处理。文章来源地址https://www.toymoban.com/news/detail-478944.html

到了这里,关于AI 人声模拟,MockingBird实现AI拟声,声音处理,基础搭建和采坑处理。的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 有手就行!Sovits AI人声模型训练

    随着AI孙燕姿的爆火出圈,各大视频平台的AI人声投稿量激增,B站首页频频给我推送相关视频,正好我对AIGC方面也挺感兴趣,心动不如行动,于是我用自己的声音训练了一个模型,发现整个过程异常的简单,并且最终出来的效果也不错,真的是有手就行,所以这次将我自己训

    2024年02月15日
    浏览(36)
  • 用Python实现AI声音克隆的原理和代码示例

    声音克隆是一种利用机器学习技术学习特定人说话的声音特征,并以此生成合成音频的技术,通常在语音合成和人机交互等领域有广泛的应用。下面是一个简单的Python实现示例: 1.数据收集 首先,需要从多个不同说话人的语音数据集中收集原始音频数据,并将其分为训练集和

    2024年02月12日
    浏览(37)
  • 【语音处理】基于加权压力匹配方法(WPMM)的私人声音系统研究(Matlab代码实现)

    💥💥💞💞 欢迎来到本博客 ❤️❤️💥💥 🏆博主优势: 🌞🌞🌞 博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️ 座右铭: 行百里者,半于九十。 📋📋📋 本文目录如下: 🎁🎁🎁 目录 💥1 概述 📚2 运行结果 🌈3 Matlab代码实现 🎉4 参考文献 在本文中

    2024年02月15日
    浏览(48)
  • 【自媒体必备】AI文字转语音,支持多种人声选择,在线生成一键导出【电脑永久版】

    AI文字转语音,支持多种人声选择,在线生成一键导出 软件是电脑版安装版本,大家根据自己安软件的习惯进行安装即可,安装后打开软件即可,且完全免费。语音选择方面就有晓晓、云扬、云希等等常用选择。点击后面的播放按钮可以先试听声音。 转换的速度挺快的,我这

    2024年02月04日
    浏览(41)
  • 人工智能AI库Spleeter免费人声和背景音乐分离实践(Python3.10)

    在视频剪辑工作中,假设我们拿到了一段电影或者电视剧素材,如果直接在剪辑的视频中播放可能会遭遇版权问题,大部分情况需要分离其中的人声和背景音乐,随后替换背景音乐进行二次创作,人工智能AI库Spleeter可以帮我们完成大部分素材的人声和背景音乐的分离流程。

    2023年04月17日
    浏览(42)
  • 音频分离:分离人声和背景音乐的方法及代码实现

    音频分离是一项重要的音频处理任务,它可以将音频信号中的人声和背景音乐分开,使得我们能够对它们进行独立的处理和分析。本文将介绍一些常用的音频分离方法,并提供相应的代码实现。 基于混合模型的音频分离方法 基于混合模型的音频分离方法利用统计模型对混合

    2024年04月23日
    浏览(61)
  • windows电脑关机开机后没声音,重启就有声音故障处理方法

    今天遇到一件非常奇葩的windows电脑, 从关机状态下进入系统没有声音,且从以下几点判断声卡硬件及驱动不存在故障,详见如下: 1、开机后任务栏右下角声音图标正常 2、声音设置——扬声器/麦克风(Realtek(R) Audio)正常; 3、windows+x键,选择“设备管理器”,找到“音频

    2024年02月07日
    浏览(82)
  • 编写C程序模拟实现单处理机系统中进程调度,实现对多个进程的调度模拟,要求采用多级反馈队列调度算法进行模拟调度。(江西师范大学)

    编写C程序模拟实现单处理机系统中进程调度,实现对多个进程的调度模拟,要求采用多级反馈队列调度算法进行模拟调度。 数据结构设计:PCB:结构体;就绪队列:每个节点为进程PCB;进程状态 具体调度算法:FCFS、SJF、PR;涉及多种操作:排序、链表操作 程序输出设计:调

    2024年02月04日
    浏览(54)
  • java 使用 jtransforms 傅里叶变换库实现删除 wav 歌曲中的人声、提取歌曲旋律功能

    引入 maven 依赖: 原理: 将音频信号进行分帧处理,将每一帧的数据进行傅里叶变换,得到短时傅里叶变换(STFT)。 对于每一帧的频谱,可以通过观察频谱图的特征来确定人声和旋律所在的频率范围。 根据人声和旋律所在的频率范围,可以将频谱图中对应的频率区域置零,

    2024年01月23日
    浏览(44)
  • whisper 语音识别AI 声音To文字

    Whisper  是一个由 OpenAI 训练并开源的神经网络,功能是语音识别,能把 语音 转换为 文字 ,在英语语音识别方面的稳健性和准确性接近人类水平。 1、Whisper支持语音转录和翻译两项功能并接受各种语音格式,模型中、英、法、德、意、日等主流语言上取得85%以上的准确率,完全

    2024年02月08日
    浏览(65)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包