MS-TTS:免费微软TTS语音合成工具(一键合成导出MP3音频)

这篇具有很好参考价值的文章主要介绍了MS-TTS:免费微软TTS语音合成工具(一键合成导出MP3音频)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

声明

  • 本工具是个免费工具,遇到问题,还请自行解决,下面有文字教程,B站有视频教程(链接在文章末尾);

  • 其次,微软接口卡顿,连接超时等问题下方有详细说明,请仔细看一下;

  • 再次,强制升级是为了统一版本方便问题的收集与解决,如果你能理解最好,不能理解的话,那建议你还是不要用了,强扭的瓜不可能甜!

前言

微软TTS文本转语音引擎的确是非常NB,合成语音非常接近真人,应该是当前同类产品中体验最好的,官网有提供在线语音合成,但不提供合成后的音频文件下载,使用时会比较麻烦,所以写成工具;

目前,MS-TTS工具经过N个版本更新,该实现的功能都已经一点点肝出来了,称它为全网最强免费TTS文本语音合成工具应该不为过,所以,接下来可能在很长一段时间内,除去发现重大bug外,应该都不会再进行大的更新了,当然,有什么好的意见建议可以继续留言告知(提示:少数人需要的特殊功能不在此范围,真有需要可联系定制)。

当前版本:v1.9.6.3

Bug反馈

遇到问题请先更新到最新版本试试!如果还是解决不了,请在公众号回复:加群,添加Q群后,提供触发Bug的具体场景,以便跟踪修复,感谢有你!


使用说明(以下内容请仔细阅读)

1、下载的压缩包记得先解压缩,再使用!!!

2、解压后运行主程序 MS-TTS.exe(注意:软件有加密保护,会被部分杀毒软件和电脑管家勿报及限制操作权限,建议将杀毒软件及电脑管家关闭后使用,当然,如果不放心,可以不要使用)

3、软件界面

ms-tts,语音识别,服务器,人工智能

3.1 接口设置

ms-tts,语音识别,服务器,人工智能

左侧最上方为TTS接口选项,当前软件支持 微软Edge 两大接口,优缺点如下:

微软 Edge
角色个性化设置 支持 不支持
稳定性 不稳定 较稳定
合成速度 一般
WAV格式 支持 不支持

接口下方代理选项专为微软接口设置,原因就是因为微软TTS服务器网络非常不稳定,如果一定要使用微软接口,有条件的话就可以使用http代理,如果没条件且又一定要使用微软接口的话,建议在01:00-11:00时间段使用,连接稳定性及合成速度相对会好一些!

3.2 选项

ms-tts,语音识别,服务器,人工智能

合成音频保存质量选项,微软接口mp3、wav两种格式都支持,Edge只支持保存mp3格式;

3.3 角色

ms-tts,语音识别,服务器,人工智能

语言:TTS文本转语音中的文本内容所属语言(一定要和合成内容的语言相对应)

语音:根据所先语言不同,对应的语音角色也不相同,要自行根据实际情况选择

风格:角色的说话语气风格

角色:这个角色一般是指角色的年龄段(实际使用效果不明显,且只有少部分角色支持)

语速:语音合成时的说话速度,0是正常水平,>0加快,<0减慢

音调:语音合成时的说话音调,0是正常水平,>0音调升高,<0音调降低

添加角色:可将设置好的角色添加到下方的角色列表,用于文本转语音时实现多角色配音的效果(不添加角色时,所有语音合成直接使用上方角色及各项设置)

3.4 简单模式-中小文本

ms-tts,语音识别,服务器,人工智能

主要用于合成文本内容不多的情况,可以更为方便快捷的对文本内容进行各种自定义

ms-tts,语音识别,服务器,人工智能

在编辑区域点击鼠标右键,会弹出右键菜单

  • 粘贴:将复制好的文本内容粘贴到编辑区域

  • 清空:清空编辑区域所有内容

  • 插入间隔:在光标所以位置插入间隔标记,后面在进行语音合成时,将会在指定位置按照设置好的间隔时间进行停顿

    ms-tts,语音识别,服务器,人工智能

  • 设置角色:使用此功能需要在左侧列表先添加角色,然后使用指定角色对选中范围文本内容进行标记,进行过角色标记的内容在后面进行语音合成时,将以指定的角色设置进行语音合成。

ms-tts,语音识别,服务器,人工智能

3.5 简单模式-超长文本

ms-tts,语音识别,服务器,人工智能

在表格区域点击鼠标右键,会弹出右键菜单:

  • 导入:导入需要进行tts合成的txt文本文件

    • 导入的txt文本大小不能超过5MB(超过5MB文本文件无法导入)

    • 导入的txt文本文件编码格式必须为UTF-8,非UTF8编码文件在导入后,在状态栏会显示“编码错误”,在进行tts语音合成时,会直接跳过

  • 清空:清空列表

  • 也可以直接选中多个txt文本文件,拖动到软件界面完成导入

3.6 SSML

ms-tts,语音识别,服务器,人工智能

SSML:是一种基于XML的语音合成标记语言,此功能一般只用于需要深度自定义的场景,使用SSML一定要按照其规定的语法及命令,否则将无法合成(命令语法错一个字母都不行),具体可点击右上方绿色文字,跳转到官方SSML文档进行学习。

SSML:主体内容不能超过2500字符(微软官方有限制)

3.7 软件设置

ms-tts,语音识别,服务器,人工智能

  • 保存目录:可自定义合成音频保存目录(打开:快速打开保存目录,选择文件夹:选择保存目标文件夹)

  • 合成音频使用原始文件名命名:在超长文本模式下生效,勾选后,最终合并音频文件名以“原始导入文本文件名_tts”进行命名

  • 合成结束打开保存目录:在语音合成任务完成后打开保存目录(如果保存文件夹已经有打开则不会再打开)

  • 分段音频合并数量:在进行超长文本合并时,如果将所有音频进行完整合并,最终生成的音频文件将会非常大,动辙几GB,于是采取了二级合并的模式,可以自行根据需求按指定数量合并(如果还是不能理解,打个比方,你的文本合成音频后,有300个音频文件,如果对这300个音频文件进行完整合并,最终合成的文件只有一个,且文件大小将会达到几GB,不方便移动传输,且合成时间会非常长,现增加的二级合并,意思就是按照指定的数量对前面生成的300个文件进行合并,比如默认二级合并数量50,意思就是以50个音频为一组,对前面的300个音频进行分开合并,这样300个音频文件合成完成后,就会生成6个二级合并的音频文件,每个二级合并音频文件大小就会降到几百MB)

  • 合成结束删除1级音频片段:1级音频片段就是最多的,4位数字开头的音频片段文件

  • 合成结束删除2级音频片段:2级音频片段就是按照上面指定分段音频合并数量对1级音频片段进行合并后生成的3位数字开头音频文件

  • 是否进行最终完整合并:就是将所有分段音频文件合并成一个音频文件。

  • 路径检测显示YES表示路径正常,可正常进行音频合并

  • 保存配置:将各项设置内容保存至配置文件(./Nconfig.ini)

注:删除音频片段时,将遵循保护性逻辑,即:在只存在1级音频片段时,即使勾选合成结束删除1级音频片段也不会执行删除,在同时存在1级音频片段与2级音频片段时,勾选删除1级音频片段生效,而2级音频片段即使勾选删除将不会执行,同理,在同时存在1级、2级音频片段,且进行了最终完整合并的前提下,勾先删除1级、2级音频片段才会生效执行。

4、多音字

MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件,

ms-tts,语音识别,服务器,人工智能

将需要自动替换的内容按照: 原始内容,替换内容 的格式一行一条,写入“dict.txt”词典文件保存即可,如下:

ms-tts,语音识别,服务器,人工智能

5、试听合成

5.1 试听

提供最长不超过150字符内容的角色声音试听,多角色只试听第一段内容

5.2 合成

按照设置好的角色对指定内容进行TTS语音合成

5.3 停止

停止正在进行的任务

软件报病毒

软件有加密保护,会被部分杀软误报,所以,如果你在使用过程中遇到这样或那样的问题,请尝试关闭各类杀毒软件或电脑管家后再试一下,当然:如果不放心请勿使用,谢谢!!!

视频教程

视频为1.9.3版本视频,多数操作相同

https://www.bilibili.com/video/BV1wg411k7SH/

下载地址

前往下载文章来源地址https://www.toymoban.com/news/detail-778040.html

到了这里,关于MS-TTS:免费微软TTS语音合成工具(一键合成导出MP3音频)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【TTS】uni-app语音播报app开发 / MT-TTS安卓原生自带语音合成插件(免费无限次)

    TTS 是 Text To Speech 的缩写,即“ 从文本到语音 ”,是人机对话的一部分,让机器能够说话。TTS是语音合成应用的一种。 在程序开发中,有很多TTS的插件,比如百度,讯飞,等等,但是大部分产品都不是完全免费无限制次数调用的且需在线使用 本篇文章介绍一种免费快捷且可

    2023年04月15日
    浏览(145)
  • 语音合成工具Coqui TTS安装及体验

    先介绍两种免费的语音合成工具 官网 http://balabolka.site/balabolka.htm 是一种基于微软Speech API (SAPI)的免费语音合成工具,只是简单的发音合成,效果比较生硬 官网 https://coqui.ai/ 是基于深度学习的语音合成软件,效果较好 Windows下安装Coqui TTS 安装环境 要求python运行环境:https://

    2024年02月15日
    浏览(46)
  • Unity C# 之 Azure 微软SSML语音合成TTS流式获取音频数据以及表情嘴型 Animation 的简单整理

    目录 Unity C# 之 Azure 微软SSML语音合成TTS流式获取音频数据以及表情嘴型 Animation 的简单整理 一、简单介绍 二、实现原理 三、注意事项 四、实现步骤 五、关键代码 Unity 工具类,自己整理的一些游戏开发可能用到的模块,单独独立使用,方便游戏开发。 本节介绍,这里在使用

    2024年02月12日
    浏览(54)
  • 文字转语音 - 搭建微软tts整合web服务提供api接口(免费)

    微软tts是业界公认文字转语音效果最佳 本文使用docker搭建微软tts服务并提供api接口对外提供服务 对接官方免费在线体验接口,搭建后可免费进行调用使用,不保证永久稳定可用 url :http://127.0.0.1:5003/tts method :POST 参数 类型 描述 text string 语音文字内容 voiceName string 发音人(

    2024年02月11日
    浏览(42)
  • 口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts实践(Python3.10)

    不能否认,微软Azure在TTS(text-to-speech文字转语音)这个人工智能细分领域的影响力是统治级的,一如ChatGPT在NLP领域的随心所欲,予取予求。君不见几乎所有的抖音营销号口播均采用微软的语音合成技术,其影响力由此可见一斑,仅有的白璧微瑕之处就是价格略高,虽然国内也可

    2024年02月02日
    浏览(49)
  • Edge-TTS:微软推出的,免费、开源、支持多种中文语音语色的AI工具

    项目地址:rany2/edge-tts: Use Microsoft Edge\\\'s online text-to-speech service from Python WITHOUT needing Microsoft Edge or Windows or an API key (github.com) Edge-TTS是由微软推出的文本转语音Python库,通过微软Azure Cognitive Services转化文本为自然语音。适合需要语音功能的开发者,GitHub上超3000星。作为国内付费

    2024年04月11日
    浏览(45)
  • ​Edge-TTS:微软推出的,免费、开源、支持多种中文语音语色的AI工具

    Edge-TTS是由微软推出的文本转语音Python库,通过微软Azure Cognitive Services转化文本为自然语音。适合需要语音功能的开发者,GitHub上超3000星。作为国内付费TTS服务的替代品,Edge-TTS支持40多种语言和300种声音,提供优质的语音输出,满足不同开发需求。 Edge-TTS 项目地址: https

    2024年04月26日
    浏览(39)
  • 真实免费易用!推荐一款AI文本转语音工具:一点红语音合成

    网上充斥着大量的文本转语音工具,但尝试下来大概分为三大类: 第一类,微软官方文本转语音工具Azure,但当你想使用的时候却会发现,目前注册需要提供支持VISA的信用卡。。 第二类,当你听完各种up主介绍之后感觉某大厂工具功能强大,想要跃跃欲试的时候,才发现接近

    2024年02月07日
    浏览(90)
  • 离线语音交互技术路线之语音合成(TTS)篇

      在ChatGPT大行其道之际,我心血来潮想要研究研究如何实现离线语音交互,把它和ChatGPT相结合,自己尝试实现个语音助手玩玩。本篇文章主要先从整体上分析了离线语音交互的技术实现路线,以及每个环节可能用到的参考技术,然后详细阐述了其中一个环节:语音合成(

    2024年02月09日
    浏览(47)
  • 微软语音合成工具+基于Electron + Vue + ElementPlus + Vite 构建并能将文字转换为语音 MP3

    资源下:微软语音合成工具+基于Electron+Vue+ElementPlus+Vite构建并能将文字转换为语音

    2024年02月04日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包