微软的技术,直接颠覆了我对听书这件事的看法

这篇具有很好参考价值的文章主要介绍了微软的技术,直接颠覆了我对听书这件事的看法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

阿虚一度是对听书不太感兴趣的(虽然一大部分原因是我看的小说没有有声书),AI机械式的发音,固定的腔调、语速,总会丢失那些波澜起伏的剧情所带来的沉浸式情感体验微软的技术,直接颠覆了我对听书这件事的看法

但最近才知道微软在 //Build 2021 大会上,发布了旗下 TTS 2021版的人工语音,让我对听书这件事简直是有了革新式的看法微软的技术,直接颠覆了我对听书这件事的看法

大家可以听听官方网页的示例,新增的这5种中文语音,根本听不出是机器在念,逼真地吓人:点击查看微软官网示例

微软的技术,直接颠覆了我对听书这件事的看法

对于喜欢听书的人来说,估计和阿虚一样心里只有一个想法吧:赶紧让我体验一下!!!

微软的技术,直接颠覆了我对听书这件事的看法

总之阿虚今天就准备来介绍一下安卓/iOS上分别怎么用上微软这些最新的TTS语音!

1 安卓端

TTS对于多数人,肯定还是用于手机上看小说,所以这里还是先介绍怎么在手机上体验微软的技术,直接颠覆了我对听书这件事的看法

1.1 TTS

目前最简单的方法就是 @ag2s20150909 制作的这款小APP了

APP的最新版发布在作者的Github:https://github.com/ag2s20150909/TTS/tree/master/release

微软的技术,直接颠覆了我对听书这件事的看法

如果你访问Github困难,建议了解《2022 Github加速访问教程》

将APP下载并安装好之后,点击左上角「设置TTS」,将手机的默认的文字转语音引擎改成「TTS」

微软的技术,直接颠覆了我对听书这件事的看法

然后回到APP内,默认的AI是晓晓,如果你要切换成其他AI,要先勾选「自定义」,然后再点击切换!微软的技术,直接颠覆了我对听书这件事的看法

阿虚自己是比较喜欢云希这个AI 的声音,讲话风格你也可以自行选择(有新闻/客服/助手/闲聊等等),阿虚自己是用的默认

微软的技术,直接颠覆了我对听书这件事的看法

然后因为TTS是系统级的功能,基本上的电子书阅读器都是支持调用系统TTS来朗读的微软的技术,直接颠覆了我对听书这件事的看法

你立马就能在你常用的阅读、静读天下这类APP上体验到微软TTS的牛逼了!

微软的技术,直接颠覆了我对听书这件事的看法

不过这个TTS据悉会时不时存在卡顿、跳读问题,网友们给出的解决方法有以下这些:

  1. 换格式
  2. 换AI发声人
  3. 换时端

换格式的意思是,在TTS右上角的设置中,更改音频流的格式

说白了就是降低音频质量,32kbit/64kbit/128kbit 这些总能明白吧微软的技术,直接颠覆了我对听书这件事的看法

理论上来说如果是网络问题导致的朗读卡顿,降低音频质量就应该是能明显改善问题的

微软的技术,直接颠覆了我对听书这件事的看法

而会出现以上问题的原因,大抵是因为大家用的都是作者的 API 导致的 (或者是作者从某处挖来的),公共服务的缺点自然是用的人越多越不好用…

1.2 大声朗读

如果你想要长期稳定可用的微软TTS服务,还是建议各位用大声朗读这款APP微软的技术,直接颠覆了我对听书这件事的看法

不过使用这款APP的前提是你得满足这俩条件之一:有国外的 edu 邮箱或者有VISA、MasterCard这类双币卡

但其实没有也有办法,你也可以借助万能的淘宝微软的技术,直接颠覆了我对听书这件事的看法

现在还是能找到很多 edu 邮箱的卖家的,不过请注意:不是所有的 edu 邮箱都能订阅 Azure⚠️,买之前请自己详询卖家!

微软的技术,直接颠覆了我对听书这件事的看法

或者你也可以选择淘宝找一家虚拟信用卡用于过 Azure 的支付验证(后续使用并不会扣费)

微软的技术,直接颠覆了我对听书这件事的看法

总之若你满足以上条件,你就能自行注册微软 Azure 服务,然后借用大声朗读这款APP,从而获取到长期稳定可用的微软TTS服务啦!微软的技术,直接颠覆了我对听书这件事的看法

这个APP是由酷安大佬 @I I I I I 开发的:http://www.coolapk.com/u/453544(可用酷安打开此链接,此链接为作者ID地址)

不过由于他现在已经隐藏了之前的动态,我没找到他原始发布的动态,你可以点击这里来获取这款APP

APP现在已经支持自动更新了,后续也不担心找不到最新版这种问题了

微软的技术,直接颠覆了我对听书这件事的看法

有国外 edu邮箱的话,你可以直接搜「面相学生的Azure」,然后填学校邮箱注册就行了,不需要信用卡(前提是你的 edu邮箱支持过Azure订阅)微软的技术,直接颠覆了我对听书这件事的看法

要国外 edu邮箱是因为,由于国人大量薅微软的羊毛,国内的 edu邮箱的优惠早被薅没了…

微软的技术,直接颠覆了我对听书这件事的看法

下面阿虚只介绍下有双币卡的情况怎么注册并使用

你别担心:双币卡只是用于过验证,并不会真的扣款,并且后续使用也并不会扣款微软的技术,直接颠覆了我对听书这件事的看法

第一步打开此地址:https://azure.microsoft.com/zh-cn/free/cognitive-services/

类似于谷歌云,首次注册 Azure 账号即微软云,会免费给你提供12个月的热门服务,还有200美元的服务付费额度,不过我们后续会用到的AI语音服务是有免费版提供的,所以并不用担心1年之后就要收费了

微软的技术,直接颠覆了我对听书这件事的看法

在上方地址「点击免费开始使用」后登录你的微软账号,并填写相关账号信息+勾选协议+填写双币信用卡信息后

微软的技术,直接颠覆了我对听书这件事的看法

耐心等待信用卡验证注册好账号后,打开此地址:https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech/

点击「已在使用Azure?立即免费试用此服务」微软的技术,直接颠覆了我对听书这件事的看法

微软的技术,直接颠覆了我对听书这件事的看法

在创建资源页面按下图方式进行,只需要注意订阅Pricing tier处都选择免费选项即可

然后点击底部的「审阅并创建」,等待审阅通过,继续点击一下「创建」

微软的技术,直接颠覆了我对听书这件事的看法

创建好之后,点击「转到资源」

微软的技术,直接颠覆了我对听书这件事的看法

点击管理密钥微软的技术,直接颠覆了我对听书这件事的看法

微软的技术,直接颠覆了我对听书这件事的看法

你会看到两个密钥,随便用一个就行

微软的技术,直接颠覆了我对听书这件事的看法

把密钥填到大声朗读的APP里即可,然后点击「SSML语音合成标记语言」微软的技术,直接颠覆了我对听书这件事的看法

微软的技术,直接颠覆了我对听书这件事的看法

输入下方代码并保存,然后就可以随心使用了 ~

微软的技术,直接颠覆了我对听书这件事的看法

关于这段代码,你可以按需调整这3部分:

  1. name=“zh-CN-YunxiNeural”,即阿虚上图使用的是Yunxi(云希)这款AI语音
  2. style=“assistant”,表示讲话风格设置的则是assistant(以热情而轻松的语气对数字助理讲话)
  3. styledegree=“2”,这个值可以指定说话风格的强度, 默认值为1,最小值0.01,最大值2
<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" 
xmlns:mstts="https://www.w3.org/2001/mstts" 
xml:lang="zh-CN">
  <voice name="zh-CN-YunxiNeural">
    <prosody rate="${(rate-100)?c}%" pitch="${(pitch-100)?c}%">
      <mstts:express-as style="assistant" styledegree="2">${text}
      </mstts:express-as>
    </prosody>
  </voice>
</speak>

如果你想要自行更换以上配置,你需要参考微软官方的文档:https://docs.microsoft.com/zh-cn/azure/cognitive-services/speech-service/speech-synthesis-markup

你需要知道的是,每个AI所拥有的 Style 风格是不一样的,比如 Yunyang 目前就只有 customerservice 这一种风格微软的技术,直接颠覆了我对听书这件事的看法

而 Yunye 则有calm、cheerful、sad、angry等等多种风格可选

微软的技术,直接颠覆了我对听书这件事的看法

最后需要注意的是目前微软Azure的免费额度是每月50万文本转语音字符微软的技术,直接颠覆了我对听书这件事的看法

最新的免费额度见这里:https://azure.microsoft.com/zh-cn/pricing/details/cognitive-services/speech-services/

2 iOS端

2.1 源阅读

iOS上就没有像安卓端的TTS那样装上就能用的APP了

目前阿虚所知仅有「源阅读」这款APP支持自定义添加微软AI语音

具体来说就是必须自己去注册微软Azure账户申请Key才能使用,具体申请步骤就请自行参考本文1.2节了,在此阿虚便不再复述

但是这里有一点非常重要的步骤需要注意:目前iOS源阅读1.4.8版本还不能自定义TTS服务区域,导致目前想要用上的话,必须在最开始创建语音服务时选择东亚地区(East Asia) ⚠️

就只有这一点需要注意,后续到是就没啥了

打开源阅读APP,找到设置 » 语音管理 » 创建云语音

微软的技术,直接颠覆了我对听书这件事的看法

服务商选择Azure,语音名称随便输入,然后填入你自己的Key,发音人的设置方法依旧请参考本文1.2节

微软的技术,直接颠覆了我对听书这件事的看法

随后就直接能在听书的时候选择并使用了

微软的技术,直接颠覆了我对听书这件事的看法

另外就是这款APP由于一些原因,在2022年1月的时候从AppStore的中国区下架了,目前想要下载这款APP,需要到国外区的AppStore下载

具体如何注册国外Apple ID,请自行参考我原来的这篇教程:https://zhuanlan.zhihu.com/p/49754407

2.2 云手机

另外一个可行的方法就是之前写iOS微信双开时候提到的,花钱使用云手机了微软的技术,直接颠覆了我对听书这件事的看法

https://mp.weixin.qq.com/s/fDtU19-QNB3tdDCaPaKOFw

云手机是安卓系统,那你就只需要回头去参考本文第一节的内容就行了

微软的技术,直接颠覆了我对听书这件事的看法

另外如果你不是想用于听书,而是想将微软AI语音用于自媒体配音,相关软件、网站请本文参看原文

微软的技术,直接颠覆了我对听书这件事的看法文章来源地址https://www.toymoban.com/news/detail-443513.html

到了这里,关于微软的技术,直接颠覆了我对听书这件事的看法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • VR直播丨颠覆性技术革命,新型直播已经到来

    细数当下最火热的营销手段,首先浮现脑海的无疑是“直播”。前有罗永浩、李佳琦,后有刘畊宏和东方甄选,直播如日中天,俨然成了大众足不出户就能休闲娱乐的重要途径。 而随着虚拟现实在“十四五规划”中被列入“建设数字中国”数字经济重点产业,VR产业软硬件技

    2023年04月19日
    浏览(40)
  • Web3解密:区块链技术如何颠覆传统互联网

    随着区块链技术的崛起,Web3正逐渐成为新一代互联网的代名词。它不再依赖中心化的权威机构,而是通过去中心化、透明、安全的特性,为用户带来更为开放和公正的互联网体验。本文将深入解密Web3,揭示区块链技术如何颠覆传统互联网的基本构架和运作方式。 Web3的最大特

    2024年01月20日
    浏览(66)
  • 数画自研chatgpt,imagegpt人工智能语言技术,颠覆对AI绘画的认知

    2023年1月1日,数画AI绘画又爆火了,这一次是数画团队自研了chatGPT+imageGPT人工智能技术,值得人们注意的是,并非引用海外的openAI人工智能语言模型,而是完全自研首发的国产人工智能技术,数画团队来自于温州专帮信息科技有限公司。 图例:国产的chatGPT和imageGPT人工智能技

    2024年02月16日
    浏览(60)
  • 知识产权保护:人工智能技术是否正在颠覆知识产权保护?如何防止这一情况的发生?

    作者:禅与计算机程序设计艺术 随着机器学习、深度学习等人工智能技术的普及,越来越多的人们开始关注其背后的知识产权保护问题。近年来,中国政府、企业和学者均呼吁对人工智能技术进行严格保护,并试图通过技术手段阻止它们侵犯他人的合法权益,如知识产权保护

    2024年02月07日
    浏览(50)
  • 微软 Visual Studio 现已内置 Markdown 编辑器,可直接修改预览 .md 文件

    大小:75.30 MB类别:文字处理 本地下载          Markdown 是一种轻量级标记语言,当开发者想要格式化代码但又不想牺牲易读性时,Markdown 是一个很好的解决方案,比如 GitHub 就使用 Markdown 来展示说明文档,也就是 .md 文件。 微软近日宣布,根据开发者的反馈,在 Visual

    2024年02月11日
    浏览(46)
  • 使用微软提供的工具获取权限删除不能直接删除的注册表(删除U盘等移动设备记录)

    在计算机HKEY_LOCAL_MACHINESYSTEMControlSet001EnumUSBSTOR中保存了电脑连接过的移动设备信息,但是直接右键无法删除项目 在网上搜索资料后发现微软有发布工具可以进行删除操作,但是需要输入命令,于是,我使用C#进行简单的封装 该代码执行后,使用psexec.exe打开注册表并可以删

    2024年02月16日
    浏览(37)
  • ARB之后,都过于焦虑了,关于撸空投这个事的一些思考和分析。

    关于撸空投这个事的一些思考和分析。 多号+长期交互+防女巫+猜项目方心思 L2上撸毛写个交互脚本其实门槛很低,因为各大L2都在对接ETH-EVM,能在ETH主网上跑的脚本甚至接口都不用动。 也别说什么脚本容易被女巫,这都不是事,如果一个人写的脚本被查那么手动一样被查。

    2024年02月22日
    浏览(37)
  • 带自动采集小说网站源码 小说听书网站源码 小说网站源码 带教程

    PTCMS可听书可下载的小说站源码 带自动采集和搭建视频教程 必装环境:Nginx(apache.iis也可),mysql,php5.6,memcached php5.6安装扩展memcache新建站点,注意新建时,PHP版本必须选择PHP5.6 安装教程 1.上传网站文件到网站目录,新建网站伪静态选择thinkphp 2.新建数据库。导入数据库文件PT

    2024年02月07日
    浏览(50)
  • 小程序毕业设计基于微信小程序的在线听书小程序-云听系统

      基于微信小程序的”云听”小程序是一个可以极大的方便用户在线听书和音乐的平台。基于微信小程序的”云听”小程序分为小程序部分和后台管理两部分,小程序部分的主要功能包含:用户注册登录,首页,音乐资源,听读信息,在线交流,个人中心;管理员部分功能

    2024年02月02日
    浏览(32)
  • 【微软知识】微软相关技术知识分享

    一、微软操作系统: 微软的操作系统主要是 Windows 系列,包括 Windows 10、Windows Server 等。了解 Windows 操作系统的基本使用、配置和故障排除是非常重要的。微软操作系统(Microsoft System)是美国微软开发的Windows系列视窗化操作系统。服务器版最高为Windows Server 2022 [2] ,个人版

    2024年02月14日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包