【 AI 两步实现文本 转 语音】

这篇具有很好参考价值的文章主要介绍了【 AI 两步实现文本 转 语音】。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

基于hugging face 中 XTTS-v2 模型做文本转语音,此模型支持17种语言

1.登录hugging face 官网

https://huggingface.curated.co/ 或者 https://hf-mirror.com/models
找到models处下载XTTS-V2
如果你全程可以联网(/huggingface.co)直接步骤2
tts_models/multilingual/multi-dataset/xtts_v2,人工智能,语音识别
搜索模型XTTS-V2,选Files and Versions下载所有文件,其中红框选出来的是训练好的模型

tts_models/multilingual/multi-dataset/xtts_v2,人工智能,语音识别

2.生成语音

from TTS.api import TTS
tts = TTS("tts_models/multilingual/multi-dataset/xtts_v2", gpu=True)

# generate speech by cloning a voice using default settings
tts.tts_to_file(text="It took me quite a long time to develop a voice, and now that I have it I'm not going to be silent.",
                file_path="output.wav",
                speaker_wav="/path/to/target/speaker.wav",
                language="en")

如果不想玩花活,这两步就可以根据文本生成语音啦!
需要说明的是:生成的方式其实有多中,可以看Model card标签

代码的参数说明一下:
text:是要转换成语音的文字
tts_models/multilingual/multi-dataset/xtts_v2不要更改,这个是有规律的命名,model名/xxx
speaker_wav:是一段现成的语音,模型根据发音的音色来生成语音,所以理论上是可以生成任何人的语音。
file_path:是生成的语音
如无法联网,把你在步骤1下载好的 模型放进模型加载的路径,这个路径怎么看呢,执行的时候,可以代码执行的终端有输出日志,下面红框可以看到:
tts_models/multilingual/multi-dataset/xtts_v2,人工智能,语音识别
我是windows,这个地方的路径是:c:users\你的用户名\AppData\Local\tts\tts_models–multilingual–multi-dataset–xtts_v2
实际这个路径是可以配置的也可以代码修改,此处可自行查询一下

3.环境怎么配置

首先基础环境配置好.

  • 要求pytorch 2.1以上,torch torchaudio等配套安装,安装方法pytorch官网
  • 安装TTS,pip install TTS

其次如果使用代码的方式比如 from TTS.api import TTS 的方式,必须得把下载的包放在你运行的代码的目录里引用,下载离线包的路径,https://pypi.tuna.tsinghua.edu.cn/simple/tts/TTS-0.22.0.tar.gz文章来源地址https://www.toymoban.com/news/detail-827529.html

到了这里,关于【 AI 两步实现文本 转 语音】的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 树莓派Linux实现ChatGPT语音交互(语音识别,TTS)

    ChatGPT使用想必大家都不陌生,进入官网,注册账号即可开始正式的对话聊天,可是如何使用ChatGPT API,且在Linux环境下进行语音交互呢?碰巧在今年暑期参加物联网设计竞赛有用到这项功能,今天就来教下大家详细步骤。 如何获取一个ChatGPT账号相比对大家来说不是一件难事,

    2024年02月08日
    浏览(41)
  • .net实现简单语音朗读(TTS)功能

    首先,添加DotNetSpeech.dll引用,可以在这里直接下载,也可以参照这篇文章说的,在安装Speech SDK以后,在Common FilesMicrosoft SharedSpeech目录下面找到SAPI.dll,用Tlbimp.exe工具将该dll转换成.net平台下的Assembly---DotNetSpeech.dll。 然后,using DotNetSpeech; 朗读功能: 注:SpeechVoiceSpeakFlags是

    2024年02月07日
    浏览(36)
  • Python使用PaddleSpeech实现语音识别(ASR)、语音合成(TTS)

    目录 安装 语音识别 补全标点 语音合成 参考 PaddleSpeech是百度飞桨开发的语音工具 注意,PaddleSpeech不支持过高版本的Python,因为在高版本的Python中,飞桨不再提供paddle.fluid API。这里面我用的是Python3.7 需要通过3个pip命令安装PaddleSpeech: 在使用的时候,urllib3库可能会报错,因

    2024年04月25日
    浏览(40)
  • 4个步骤实现Java版的TTS(文字转语音)

    TTS是Text To Speech的缩写,即“从文本到语音”,让机器能够说话。 微软自带TTS(Text To Speech) 语音引擎,可以将文本转换成语音播报。 现在通过Java程序(jacob包),利用Windows自带的TTS实现语言的播报。 详细步骤如下: 下载jacob jar包和dll文件 将dll放置到相应的文件目录中 将

    2024年02月07日
    浏览(64)
  • vue使用WEB自带TTS实现语音文字互转

    时隔多日,自己已经好久没更新文章了;今年一直跟随公司的政策[BEI YA ZHA]中,做了一个又一个的需求,反而没有多少自己的时间,更别说突破自己 ˚‧º·(˚ ˃̣̣̥᷄⌓˂̣̣̥᷅ )‧º·˚ (雾) 然后最近,我朋友突然和我说有没有做过TTS,我第一反应是??? ʕ •ᴥ•ʔ…… 一

    2024年02月04日
    浏览(47)
  • Python调用edge-tts实现在线文字转语音

    edge-tts是一个 Python 模块,允许通过Python代码或命令的方式使用 Microsoft Edge 的在线文本转语音服务。 GitHub - rany2/edge-tts: Use Microsoft Edge\\\'s online text-to-speech service from Python WITHOUT needing Microsoft Edge or Windows or an API key Use Microsoft Edge\\\'s online text-to-speech service from Python WITHOUT needing Micro

    2024年03月27日
    浏览(54)
  • 字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言(Python3.10)

    按照固有的思维方式,如果想要语音克隆首先得有克隆对象具体的语言语音样本,换句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨语种无需训练的语音克隆技术。 coqui-ai TTS实现跨语种、无需训练克隆语音的方法是基于Tacotron模

    2024年02月03日
    浏览(37)
  • 真实免费易用!推荐一款AI文本转语音工具:一点红语音合成

    网上充斥着大量的文本转语音工具,但尝试下来大概分为三大类: 第一类,微软官方文本转语音工具Azure,但当你想使用的时候却会发现,目前注册需要提供支持VISA的信用卡。。 第二类,当你听完各种up主介绍之后感觉某大厂工具功能强大,想要跃跃欲试的时候,才发现接近

    2024年02月07日
    浏览(89)
  • Bark Ai 文本转语音 模型缓存位置修改

    默认缓存位置在:~/.cache 加入环境变量:XDG_CACHE_HOME,指定缓存位置 修改后新的位置为: D:AiBarkBark Cache

    2024年02月07日
    浏览(39)
  • 【AI】文本转语音 变声 音色克隆 数字人音视频口型同步AI应用

    项目地址:https://github.com/coqui-ai/TTS 环境安装: 下载项目; 安装Python,安装项目依赖: 1. 下载安装AI模型: https://github.com/facebookresearch/fairseq/tree/main/examples/mms 模型文件放到:C:UsersAdministratorAppDataLocaltts 2. 将文本转换为语音: tts --text “要转换的文本内容” --model_name “指

    2024年02月19日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包