记录在linux上使用科大讯飞的语音识别的全过程

这篇具有很好参考价值的文章主要介绍了记录在linux上使用科大讯飞的语音识别的全过程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、科大讯飞官网

        1.网址讯飞开放平台-以语音交互为核心的人工智能开放平台 (xfyun.cn)。

        2.登录上述网站。

        3.点击控制台,创建应用。

        4.再在网页中找到语音听写功能,就是本次需要使用到的语音转文字功能,有很多入口可以进入,进入后请自行查看相关介绍,有助于后面的程序开发,入口其位置如图1.1所示。

科大讯飞语音识别csdn,语音识别,人工智能图1.1 语音听写

        5.将网页拉到下面的开发者资源,将Linux的SDK文档打开,本次实验的相关步骤根据该文档进行,文档入口如图1.2所示。

科大讯飞语音识别csdn,语音识别,人工智能图1.2 Linux的文档入口

        6.下载Linux的SDK资源,找到SDK下载入口,如图1.2所示。

科大讯飞语音识别csdn,语音识别,人工智能图1.3 SDK下载入口

        7.进入页面口应用选择已经创建好的应用,平台选择Linux,ai能力选择语音听写,点击下载。如图1.4所示。

科大讯飞语音识别csdn,语音识别,人工智能图1.4 下载SDK

二、SDK包的处理

        1.其处理过程根据上述的SDK文档进行,具体操作如下:

       (1)、 新建目录Demo,将SDK中bin,include,libs文件夹复制到新建工程“Demo”文件夹下,如图2.1创建demo文件夹,并复制文件。

科大讯飞语音识别csdn,语音识别,人工智能图2.1 demo文件夹

       (2)、将sample文件夹的麦克风输入语音识别的文件拷贝到demo,sample中文件分别对应不同的ai能力。如图2.2所示。

科大讯飞语音识别csdn,语音识别,人工智能图2.2 移动源码文件夹

        (3)、打开文件夹iat_online_record_sample中的Makefile文件,修改相关路径。如图2.3所示。

科大讯飞语音识别csdn,语音识别,人工智能图2.3 修改Makefile

        (4)、打开文件夹iat_online_record_sample中的64bit_make.sh文件,修改相关路径。如图2.3所示。

科大讯飞语音识别csdn,语音识别,人工智能图2.3 修改sh脚本

        2、在测试之前,先检查自己的麦克风,以及虚拟机Linux的联网状态。

        麦克风测试,可以声音输入,如图2.4所示。

科大讯飞语音识别csdn,语音识别,人工智能

图2.4 麦克风测试

        虚拟机网络适配器选择NAT,联网测试,ping通百度,如图2.5所示。   科大讯飞语音识别csdn,语音识别,人工智能图2.5 联网测试

        3、在虚拟机中编译文件,并执行,详情如图2.6所示。

科大讯飞语音识别csdn,语音识别,人工智能图2.6 demo运行结果

三、温馨提示

       1.麦克风的采样率要符合科大讯飞要求(官方文档:sdk目前支持的格式是 pcm 和 wav 格式、音频采样率要是 16k 或者 8k、采样精度16 位、单声道音频),本次测试电脑麦克风和外接麦克风都好使,配置及检测如图3.1所示。

科大讯飞语音识别csdn,语音识别,人工智能图3.1 麦克风配置及检测

        2.程序执行时,看麦克风是否被当前的虚拟机占用(才是对的),如果被别的进程占用,测试会失败(可能会出现-77的错误),可以重启电脑解决,或和关闭对应进程。

科大讯飞语音识别csdn,语音识别,人工智能

        3.语音文字并不是15秒后一次性转换,而是停止语音输入后,立马输出,可以多次输入与转换。文章来源地址https://www.toymoban.com/news/detail-850472.html

到了这里,关于记录在linux上使用科大讯飞的语音识别的全过程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 科大讯飞语音SDK下载及测试

    一、SDK 下载 进入讯飞开发平台官网http://www.xfyun.cn/,右上角进行注册登录,登录后点击进入SDK下载。            2.创建新应用               3.填入相关信息         4.创建完后提交后回到SDK下载页面,刷新页面,应用选择前面创建的应用,平台选择Linux,SDK选择

    2024年02月08日
    浏览(74)
  • 科大讯飞语音合成Java springboot集成

    科大讯飞语音合成 文本转语音 一、引入依赖: 二、下载响应的sdk,我这里是下载的java win版本的sdk SDK下载 - 科大讯飞api接口 - 讯飞开放平台 三、具体代码: 从下载的依赖里面找到对应文件,给代码里面替换成你的绝对路径,运行即可 备注:这个地方需要你自己的账号下载

    2024年02月15日
    浏览(51)
  • vue 利用科大讯飞实现实时语音转写

    1:新建js文件,该文件在科大讯飞api的demo种可以找到 2: 引入第一个文件在vue页面中 3:如果在引入的过程中有些关于worker的报错,可以参考以下方法  在vue.config.js中加入  

    2024年02月12日
    浏览(44)
  • 技术解读 | 科大讯飞语音技术最新进展之二:语音识别与语音合成

    这一篇内容将围绕语音识别与合成方向,继续为大家带来相关技术解析。 “风物长宜放眼量”。面向人机交互更加自然流畅的未来,智能语音技术进展如何?该走向何方? 以下内容根据讯飞研究院杰出科学家潘嘉在NCMMSC 2022上的主题演讲《科大讯飞语音技术前沿进展》整理。

    2024年02月07日
    浏览(60)
  • GEC6818科大讯飞离线语音识别

    在下载SDK时需要注意选择Linux的版本!! 在官网下载离线语音的包,解压后可以得到下面的一些文件夹: 解压后你需要知道自己命令放在下面的文件夹中 关于Make file文件: 关于asr_offline_sample.c文件: asr_offline_sample.c 文件是我们更改为自己的逻辑的文件,但是也不需要都了解

    2024年01月17日
    浏览(55)
  • 微信小程序调用科大讯飞 在线合成语音接口(文字转语音)

    科大讯飞在线文档 https://www.xfyun.cn/doc/tts/online_tts/API.html 科大讯飞调用接口 地址 https://blog.csdn.net/jinxi1112/article/details/122835386 微信小程序base64转ArrayBuffer替代方案 https://www.homedt.net/43939.html 注意点 调用函数 参考大佬的实例 这里说一下注意的点 微信小程序 不支持在线的 base64

    2024年02月10日
    浏览(44)
  • C#调用科大讯飞离线语音合成实现文本转语音

    文本转语音(Text To Speech),简称TTS,在很多业务场景会用到,比如广播大厅,人机互动等。C#要实现TTS有不少选择,比如调用System.Speech,此处就不细说了,下面主要介绍一下C#调用科大讯飞的离线语音合成SDK来实现文本转语音。 地址:[https://www.xfyun.cn/service/offline_tts] 一、创建

    2024年02月12日
    浏览(44)
  • UE4如何接入科大讯飞的语音识别

    本文用的是UE4 4.27测试 安卓版测试链接: 链接:https://pan.baidu.com/s/1CsdJecfyMTdxNd6XfSECQQ 提取码:m122 B站视频连接:https://space.bilibili.com/449549424?spm_id_from=333.1007.0.0 GitHub地址:https://github.com/zhangmei126/XunFei 第一步 新建一个VS的UE4 4.27项目工程(注意是UE4 4.27 VS项目) 第二步 新建一

    2023年04月08日
    浏览(55)
  • 科大讯飞 新版AIkit 离线语音听写 Java 版本

    前言:科大讯飞的新版离线语音听写,由于官网demo是kt语言开发的,咱也看不懂kt,搜遍了全网也没看到一个java版的新版离线语音demo,现记录下,留给有缘人参考!!!!!毕竟咱在这上面遇到了不少的坑。如果能留言指正,那就更好了。 实测一点问题都没 一、先把官网

    2024年02月22日
    浏览(42)
  • 【人工智能】科大讯飞语音识别应用开发(第三集)

    这次需要对科大讯飞语音识别接口进行语音识别应用开发,前两次都是通过WebAPI调用接口,这次换一下,通过SDK调用接口 下面是开发的详细记录过程(基于前两次的基础上) 网址:https://www.xfyun.cn/services/voicedictation 不领服务量为500且该包免费( 貌似是不同应用都可以免费领

    2024年02月13日
    浏览(54)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包