微软认知服务-语音识别相关

这篇具有很好参考价值的文章主要介绍了微软认知服务-语音识别相关。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

微软认知服务

在csdn上面看到有微软认知服务的试用,之前正好因为一些需求,接触到了这块的一些东西,正好总结一下,之前使用的是国外的账号,这个登录以后看到是国内世纪互联运营的国内的azure,在识别这块应该针对中文方面有更好的适配

0元试用微软 Azure人工智能认知服务,精美礼品大放送(https://bbs.csdn.net/topics/601636817)

提供了下面的服务

使用Azure认知服务免费提供的AI服务(包括语音转文本、文本转语音、语音翻译、文本分析、文本翻译、语言理解)
我们来一个个的试用提供的功能

语音转文本

语音转文本的需求之前遇到过,看视频教程的时候,如果能够提前拿到整个声音的文字的内容,然后大概的过一遍,这样看视频的时候就更好了,就跟我们读书的时候,老师讲教材的内容,我们看重点关注的地方,而不用讲完了还在想刚刚漏了什么

还有个需求就是开会的时候,可以录下来,然后把会议记录转成文字的,虽然目前有很多硬件设备能够完成这个,但是拿个手机就可以录是最方便的,然后再处理下形成文字的版本
有新的电影,字幕还没有出来,想看下,自己做字幕,还有很多方面的,应用,需要实现的就是把一段语音转换成文本
azure speech密钥,云计算相关,语音识别,microsoft,人工智能

azure speech密钥,云计算相关,语音识别,microsoft,人工智能
azure speech密钥,云计算相关,语音识别,microsoft,人工智能
azure speech密钥,云计算相关,语音识别,microsoft,人工智能
azure speech密钥,云计算相关,语音识别,microsoft,人工智能
服务就部署完成了

转到服务
azure speech密钥,云计算相关,语音识别,microsoft,人工智能

这里就是这个服务的节点了,那个密钥与终结点就是后面需要用的一些信息

官方有一些参考手册,但是很多坑可能不会写出来,这里我用我能够跑通的进行记录,比如在centos7和centos8上面的python的sdk就有问题,但是ubuntu就没有问题,这里我们用ubuntu的环境做测试

安装和导入语音sdk

sdk就是一些封装好的东西,我们去调用就行,这个地方我对python的熟悉一些就使用python去操作
环境使用的是ubuntu18

pip3 install azure-cognitiveservices-speech

对音频有一定的要求

root@ubuntu-virtual-machine:~/rec# file voice.wav
voice.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 48000 Hz
root@ubuntu-virtual-machine:~/rec# file whatstheweatherlike.wav
whatstheweatherlike.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 16000 Hz

注意开头静音控制

import azure.cognitiveservices.speech as speechsdk

def from_file():
    speech_config = speechsdk.SpeechConfig(subscription="xxxxxxxxxxxxx",endpoint="https://chinaeast2.api.cognitive.azure.cn/sts/v1.0/issuetoken")
    speech_config.speech_recognition_language="zh-cn"
    #audio_input = speechsdk.AudioConfig(filename="whatstheweatherlike.wav")
    audio_input = speechsdk.AudioConfig(filename="voice.wav")
    speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config, audio_config=audio_input)
    result = speech_recognizer.recognize_once_async().get()
    if result.reason == speechsdk.ResultReason.RecognizedSpeech:
        print("Recognized: {}".format(result.text))
    elif result.reason == speechsdk.ResultReason.NoMatch:
        print("No speech could be recognized: {}".format(result.no_match_details))
    elif result.reason == speechsdk.ResultReason.Canceled:
        cancellation_details = result.cancellation_details
        print("Speech Recognition canceled: {}".format(cancellation_details.reason))
        if cancellation_details.reason == speechsdk.CancellationReason.Error:
            print("Error details: {}".format(cancellation_details.error_details))

    print(result.text)

from_file()

提供音频的例子
准备找个新闻联播的来识别
注意开头不能静音太久,会有问题,应该有参数控制文章来源地址https://www.toymoban.com/news/detail-627673.html

到了这里,关于微软认知服务-语音识别相关的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【0元试用微软 Azure人工智能认知服务】我做了个群聊天机器人

    我这边参加了CSDN与微软Azure举办的0元试用微软Azure人工智能认知服务活动。第一次使用微软Azure 认知服务,老实说,还是满心期待的。 登录地址: 点此开启试用之旅 ,这个认知服务有点不好找,还有有个搜索的功能,直接搜索一下,认知服务,即可找到本次测评所需要的服

    2024年02月05日
    浏览(38)
  • 如何注册微软Azure并获取语音合成服务?

    按步骤,一步步来。 使用条件,以下可选: 1、有信用卡 2、有学生邮箱、学校邮箱。 步骤: 1、打开地址,去注册。 信用卡注册: 文本转语音 – 真实 AI 语音生成器 | Microsoft Azure 学生邮箱: 面向学生的 Azure - 免费帐户额度 | Microsoft Azure 2、注册后去后台,打开语音服务。 后

    2024年02月03日
    浏览(34)
  • 【Microsoft Azure 的1024种玩法】五十五.Azure speech service之通过JavaScript快速实现文本转换为语音

    文本转语音可使用语音合成标记语言 (SSML) 将输入文本转换为类似人类的合成语音,本篇文档主要介绍了如何通过JavaScript 的语音SDK实现文本转换为语音的实践操作 【Microsoft Azure 的1024种玩法】一.一分钟快速上手搭建宝塔管理面板 【Microsoft Azure 的1024种玩法】二.基于Azure云平

    2024年02月09日
    浏览(29)
  • 使用微软Azure的tts文本转语音服务出现java.lang.UnsatisfiedLinkError

    最近,在使用微软tts文本转语音的speech服务时,项目正常整合了微软的依赖,服务也正常启动。但是只要调用微软文本转语音服务api时,就会出现如下报错。 该方法是一个native方法,我以为是依赖中的dll文件没有加载到,结果检查不是。 最后分析:native依赖的是底层实现的

    2024年02月14日
    浏览(40)
  • 接入谷歌的语音识别(speech-to-text)

    讲一下写这篇文章的背景。 因为需求需要,我们APP需要做一个语音转化成文字的功能。因为我们做的是海外产品,需要支持多语言,当前对多语言语音识别支持的最好的解决方案当属谷歌家的了。通过对谷歌的speech-to-text调研和一些其他原因,我们决定通过服务端去接入谷歌

    2024年02月12日
    浏览(31)
  • 【Microsoft Azure 的1024种玩法】五十四. 十分钟快速上手创建部署Azure speech服务

    Azure语音服务是Microsoft提供稳定可靠的云通信服务,其在单个 Azure 订阅中统合了语音转文本、文本转语音以及语音翻译功能,我们可以通过各种方式(语音 CLI、语音 SDK、Speech Studio )来实现语音转文本、文本转语音等功能,本篇文档主要介绍了如何快速上手创建部署Azure sp

    2024年02月12日
    浏览(28)
  • media-微软Azure文字转语音

    media-微软Azure文字转语音 前篇 官方 免费服务 - https://portal.azure.com/?quickstart=True#blade/Microsoft_Azure_Billing/FreeServicesBlade 价格表: https://azure.microsoft.com/zh-cn/pricing/details/cognitive-services/speech-services/ 文字转语音–最像人类声音的免费语音合成服务|微软azure(2021) - https://www.youtube.com

    2024年02月06日
    浏览(31)
  • 基于深度学习的语音识别(Deep Learning-based Speech Recognition)

    随着科技的快速发展,人工智能领域取得了巨大的进步。其中,深度学习算法以其强大的自学能力,逐渐应用于各个领域,并取得了显著的成果。在语音识别领域,基于深度学习的技术也已经成为了一种主流方法,极大地推动了语音识别技术的发展。本文将从深度学习算法的

    2024年02月04日
    浏览(28)
  • 文本转语音免费 微软Azure官网,在线就可以转语音。

    使用跨 140 种语言和变体的 400 种神经网络语音吸引全球受众。使用极具表现力和类似人类的声音,使文本阅读器和已启用语音的助理等方案栩栩如生。神经网络文本转语音支持多种朗读风格,包括新闻广播、客户服务、呼喊、耳语以及高兴、悲伤等情感。 地址 文本转语音

    2024年02月05日
    浏览(25)
  • azure微软文字转语音工具​AzureTools​使用

    文章目录 前言 一、 AzureTools 是什么? 二、使用步骤 1.安装 2.使用 总结 最近事情不多,作为开发人员总是停不下来,就想写点啥,研究点啥。当下短视频比较火所以研究了下视频剪辑,发现很多人在用微软的Azure文字转语音功能实现配音,但是使用这个有一个弊端就是转完后

    2024年02月04日
    浏览(26)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包