【 AI 两步实现文本 转 语音】

这篇具有很好参考价值的文章主要介绍了【 AI 两步实现文本 转 语音】。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

基于hugging face 中 XTTS-v2 模型做文本转语音,此模型支持17种语言

1.登录hugging face 官网

https://huggingface.curated.co/ 或者 https://hf-mirror.com/models
找到models处下载XTTS-V2
如果你全程可以联网(/huggingface.co)直接步骤2
tts_models/multilingual/multi-dataset/xtts_v2,人工智能,语音识别
搜索模型XTTS-V2,选Files and Versions下载所有文件,其中红框选出来的是训练好的模型

tts_models/multilingual/multi-dataset/xtts_v2,人工智能,语音识别

2.生成语音

from TTS.api import TTS
tts = TTS("tts_models/multilingual/multi-dataset/xtts_v2", gpu=True)

# generate speech by cloning a voice using default settings
tts.tts_to_file(text="It took me quite a long time to develop a voice, and now that I have it I'm not going to be silent.",
                file_path="output.wav",
                speaker_wav="/path/to/target/speaker.wav",
                language="en")

如果不想玩花活,这两步就可以根据文本生成语音啦!
需要说明的是:生成的方式其实有多中,可以看Model card标签

代码的参数说明一下:
text:是要转换成语音的文字
tts_models/multilingual/multi-dataset/xtts_v2不要更改,这个是有规律的命名,model名/xxx
speaker_wav:是一段现成的语音,模型根据发音的音色来生成语音,所以理论上是可以生成任何人的语音。
file_path:是生成的语音
如无法联网,把你在步骤1下载好的 模型放进模型加载的路径,这个路径怎么看呢,执行的时候,可以代码执行的终端有输出日志,下面红框可以看到:
tts_models/multilingual/multi-dataset/xtts_v2,人工智能,语音识别
我是windows,这个地方的路径是:c:users\你的用户名\AppData\Local\tts\tts_models–multilingual–multi-dataset–xtts_v2
实际这个路径是可以配置的也可以代码修改,此处可自行查询一下

3.环境怎么配置

首先基础环境配置好.

  • 要求pytorch 2.1以上,torch torchaudio等配套安装,安装方法pytorch官网
  • 安装TTS,pip install TTS

其次如果使用代码的方式比如 from TTS.api import TTS 的方式,必须得把下载的包放在你运行的代码的目录里引用,下载离线包的路径,https://pypi.tuna.tsinghua.edu.cn/simple/tts/TTS-0.22.0.tar.gz文章来源地址https://www.toymoban.com/news/detail-827529.html

到了这里,关于【 AI 两步实现文本 转 语音】的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 树莓派Linux实现ChatGPT语音交互(语音识别,TTS)

    ChatGPT使用想必大家都不陌生,进入官网,注册账号即可开始正式的对话聊天,可是如何使用ChatGPT API,且在Linux环境下进行语音交互呢?碰巧在今年暑期参加物联网设计竞赛有用到这项功能,今天就来教下大家详细步骤。 如何获取一个ChatGPT账号相比对大家来说不是一件难事,

    2024年02月08日
    浏览(31)
  • .net实现简单语音朗读(TTS)功能

    首先,添加DotNetSpeech.dll引用,可以在这里直接下载,也可以参照这篇文章说的,在安装Speech SDK以后,在Common FilesMicrosoft SharedSpeech目录下面找到SAPI.dll,用Tlbimp.exe工具将该dll转换成.net平台下的Assembly---DotNetSpeech.dll。 然后,using DotNetSpeech; 朗读功能: 注:SpeechVoiceSpeakFlags是

    2024年02月07日
    浏览(27)
  • Python使用PaddleSpeech实现语音识别(ASR)、语音合成(TTS)

    目录 安装 语音识别 补全标点 语音合成 参考 PaddleSpeech是百度飞桨开发的语音工具 注意,PaddleSpeech不支持过高版本的Python,因为在高版本的Python中,飞桨不再提供paddle.fluid API。这里面我用的是Python3.7 需要通过3个pip命令安装PaddleSpeech: 在使用的时候,urllib3库可能会报错,因

    2024年04月25日
    浏览(28)
  • 4个步骤实现Java版的TTS(文字转语音)

    TTS是Text To Speech的缩写,即“从文本到语音”,让机器能够说话。 微软自带TTS(Text To Speech) 语音引擎,可以将文本转换成语音播报。 现在通过Java程序(jacob包),利用Windows自带的TTS实现语言的播报。 详细步骤如下: 下载jacob jar包和dll文件 将dll放置到相应的文件目录中 将

    2024年02月07日
    浏览(48)
  • vue使用WEB自带TTS实现语音文字互转

    时隔多日,自己已经好久没更新文章了;今年一直跟随公司的政策[BEI YA ZHA]中,做了一个又一个的需求,反而没有多少自己的时间,更别说突破自己 ˚‧º·(˚ ˃̣̣̥᷄⌓˂̣̣̥᷅ )‧º·˚ (雾) 然后最近,我朋友突然和我说有没有做过TTS,我第一反应是??? ʕ •ᴥ•ʔ…… 一

    2024年02月04日
    浏览(38)
  • Python调用edge-tts实现在线文字转语音

    edge-tts是一个 Python 模块,允许通过Python代码或命令的方式使用 Microsoft Edge 的在线文本转语音服务。 GitHub - rany2/edge-tts: Use Microsoft Edge\\\'s online text-to-speech service from Python WITHOUT needing Microsoft Edge or Windows or an API key Use Microsoft Edge\\\'s online text-to-speech service from Python WITHOUT needing Micro

    2024年03月27日
    浏览(36)
  • 字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言(Python3.10)

    按照固有的思维方式,如果想要语音克隆首先得有克隆对象具体的语言语音样本,换句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨语种无需训练的语音克隆技术。 coqui-ai TTS实现跨语种、无需训练克隆语音的方法是基于Tacotron模

    2024年02月03日
    浏览(29)
  • 真实免费易用!推荐一款AI文本转语音工具:一点红语音合成

    网上充斥着大量的文本转语音工具,但尝试下来大概分为三大类: 第一类,微软官方文本转语音工具Azure,但当你想使用的时候却会发现,目前注册需要提供支持VISA的信用卡。。 第二类,当你听完各种up主介绍之后感觉某大厂工具功能强大,想要跃跃欲试的时候,才发现接近

    2024年02月07日
    浏览(78)
  • Bark Ai 文本转语音 模型缓存位置修改

    默认缓存位置在:~/.cache 加入环境变量:XDG_CACHE_HOME,指定缓存位置 修改后新的位置为: D:AiBarkBark Cache

    2024年02月07日
    浏览(31)
  • 使用 Whisper AI 领先游戏:最佳和免费的语音到文本 AI

    Whisper AI 是一种语音识别和转录软件,它使用人工智能 (AI) 将口头语言转换为书面文本。它旨在通过消除手动转录语音内容的需要来帮助个人和企业节省时间并提高工作效率。在下文中,您将学习如何使用 Whisper AI! 该软件能够识别和转录多种语言和口音的语音,并提供标点

    2024年02月09日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包