语音识别开源库 FastARS 移植到GEC6818开发版

这篇具有很好参考价值的文章主要介绍了语音识别开源库 FastARS 移植到GEC6818开发版。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

FastARS 移植

移植 安装fftw3

1.下载源码
wget -c http://www.fftw.org/fftw-3.3.10.tar.gz
​
2.解压
tar -xzvf fftw-3.3.10.tar.gz 
cd fftw-3.3.10/
​
3.配置当前的运行编译环境 
export CC=arm-linux-gcc
export CXX=arm-linux-g++
mkdir  /usr/local/opt/fftw/  -p  
sudo chmod  777  /usr/local/opt/fftw/
./configure --host=arm-linux --enable-shared --enable-float
            --prefix=/usr/local/opt/fftw/
​
4.编译安装 
make  
make install 

移植 OpenBLAS

1.下载源码
wget -c https://github.com/xianyi/OpenBLAS/releases/download/v0.3.20/OpenBLAS-0.3.20.tar.gz
​
2.解压
tar -xzvf OpenBLAS-0.3.20.tar.gz  
cd OpenBLAS-0.3.20
    
3.编译 
make TARGET=ARMV7 HOSTCC=gcc BINARY=32 CC=arm-linux-gcc FC=arm-linux-gfortran
   
4.安装 
sudo mkdir  /usr/local/opt/openblas/  -p 
sudo make PREFIX=/usr/local/opt/openblas/ install   

移植 FastARS

1.下载最新版的源码
git clone https://github.com/chenkui164/FastASR.git
​
2.编译最新版的源码,
cd FastASR/
mkdir build
cd build

3.编写交叉编译的cmake 脚本

vi  arm_linux_setup.cmake
    
#填写如下内容 
set(CMAKE_SYSTEM_NAME Linux)
set(CMAKE_SYSTEM_PROCESSOR arm)
set(CMAKE_C_COMPILER /usr/local/arm/5.4.0/usr/bin/arm-linux-gcc)
set(CMAKE_CXX_COMPILER /usr/local/arm/5.4.0/usr/bin/arm-linux-g++)   
    
参数说明: CMAKE_C_COMPILER  设置交叉编译器的路径 
         CMAKE_CXX_COMPILER 设置交叉编译器的路径  

4.生成makefile 脚本

cmake -DCMAKE_TOOLCHAIN_FILE=./arm_linux_setup.cmake ..

5.编译安装

make 
make install 

6.进入 examples 目录看看是否成功生成

语音识别开源库 FastARS 移植到GEC6818开发版

 

移植到GEC6818开发板

1.把生成的 k2_rnnt2_cli 下载到开发板的 /bin 目录

语音识别开源库 FastARS 移植到GEC6818开发版2.把所有的库文件下载到开发板的 /lib 目录

 语音识别开源库 FastARS 移植到GEC6818开发版

 

3.下载语音网络模型到开发版中 (模型转换请看原作者github)语音识别开源库 FastARS 移植到GEC6818开发版

 

4.测试使用

[root@GEC6818 /]#k2_rnnt2_cli    /yyy  my.wav   
Audio time is 5.029750 s. len is 80476
Model initialization takes 9.790232s.
Result: "你吃饭了吗".
Model inference takes 18.692995s.
[root@GEC6818 /]#
    
//命令说明
k2_rnnt2_cli    /yyy  my.wav    
k2_rnnt2_cli : 语音识别程序 
/yyy         : vocab.txt  wenet_params.bin  模型所存放的目录  
my.wav       : 需要识别的音频文件

PS:因为当前的开发版没有GPU 且使用的是32位的编译器,所以识别时间较长。

附件:已经移植好的相关文件

链接:百度网盘 请输入提取码 提取码:2333 --来自百度网盘超级会员V4的分享文章来源地址https://www.toymoban.com/news/detail-422216.html

到了这里,关于语音识别开源库 FastARS 移植到GEC6818开发版的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 粤嵌Linux GEC6818开发板实现电子相册

    最近学校要求使用粤嵌的开发板实现电子相册,具体的功能要有点击特定的区域实现上一张、下一张、自动播放图片、黑屏退出应用程序、左右滑动切换图片相关功能。其中涉及到的知识点也比较多(文件IO、内存映射、触摸屏、bmp图片格式、进程、线程创建和同步、字符串

    2024年02月04日
    浏览(50)
  • 基于粤嵌gec6818开发板嵌入式开发电子相册,音乐播放,视频播放,2048游戏

    实现功能:本系统需要使用粤嵌的GEC-6818开发板设计一款娱乐影音系统,其中包括图片显示(相册)、音乐播放、视频播放,游戏四个部分,在每个部分内部,具有操控各个部分的功能触摸按键。本系统还应具有蓝牙远程操控功能。 具体要求:对使用者具有良好的可视交互体

    2024年02月13日
    浏览(65)
  • LCD(GEC6818)

    此篇博客是基于GEC6818开发板使用 1、液晶屏的基本概念 像素:屏幕上显示颜色的最小单位,英文叫pixel。注意,位图(jpg,bmp等格式的常见图片)也是由一个个的像素点构成的,跟屏幕的像素点的概念一样。原理上讲,将一张位图显示到屏幕上,就是将图片上的像素点一个个

    2024年02月09日
    浏览(33)
  • 基于GEC6818的触摸屏

    连接操作系统的输入设备,可不止一种,也许是一个标准PS/2键盘,也许是一个USB鼠标,或者是一块触摸屏,甚至是一个游戏机摇杆,Linux在处理这些纷繁各异的输入设备的时候,采用的办法还是找中间层来屏蔽各种细节,请看下图: 在Linux的内核中,对输入设备的使用,实际

    2024年02月05日
    浏览(55)
  • 6.串口通信和传感器的使用----粤嵌gec6818开发板上实现智能家居(光照气度,压强,海拔,湿度,温度达到临界值蜂鸣器自动警报等)

    串口是一种简单的通信接口,也是单片机中最常用,最简单的通信方式 通常传感器都是采用串口作为与上位机的通信接口 ARM板上提供了三个可以外接传感器的串口接口,位于开发板的右上角, 从上到下分别是: ​ 串口号 串口驱动设备文件名 ​ CON2 “/dev/ttySAC1” ​ CON3 “

    2024年02月16日
    浏览(144)
  • 基于GEC6818的智能火锅点餐系统

    本次项目开发环境:gec6818,QT5.14.2,SecureCRT。 所使用的相关技术:c/s架构,STL库,C++封装,标准化代码编写 实现的功能:用户登录页面,食品分区在不同页面,用户点餐页面,用户买单页面,数据整合并发送至后台,后台成功接受数据,返回主页面。 1、gec6818开发板的特点

    2024年02月12日
    浏览(36)
  • 粤嵌Gec6818---小项目功能实现(RFID+图片显示+音乐+视频)

    项目设计开发环境: (1)VMware Workstation Pro软件 (2)ubuntu12 .04 (能交叉编译就行) (3)SecureCRT  (4)代码编译器(notepad++/Visual Studio Code) 项目功能描述: (1)幻灯片:开始进行图片幻灯片显示,结束后进入RFID刷卡开锁界面。 (2)RFID:刷卡成功和刷卡失败两种状态(

    2024年02月08日
    浏览(50)
  • 粤嵌Gec6818---小项目功能实现简单步骤(RFID+图片显示+音乐+视频)

    项目设计开发环境: (1)VMware Workstation Pro软件 (2)ubuntu12 .04 (能交叉编译就行) (3)SecureCRT  (4)代码编译器(notepad++/Visual Studio Code) 项目功能描述: (1)幻灯片:开始进行图片幻灯片显示,结束后进入RFID刷卡开锁界面。 (2)RFID:刷卡成功和刷卡失败两种状态(

    2024年02月04日
    浏览(34)
  • 开源C++智能语音识别库whisper.cpp开发使用入门

    whisper.cpp是一个C++编写的轻量级开源智能语音识别库,是基于openai的开源python智能语音模型whisper的移植版本,依赖项少,内存占用低,性能更优,方便作为依赖库集成的到应用程序中提供语音识别功能。 以下基于whisper.cpp的源码利用C++ api来开发实例demo演示读取本地音频文件

    2024年02月20日
    浏览(48)
  • 学习笔记(1)——粤嵌gec6818实现电子相册,音乐播放器,视频播放器。

    (1)设计一个初始界面,并且设置电子相册,音乐播放器,视频播放器三个触摸按键。 (2)电子相册——能够实现相册的幻灯片功能,实现相册左右滑动切换相片。 (3)音乐播放器实现——切歌,播放和暂停功能。 (4)视频播放器实现——播放、暂停、音量大小、快进倒

    2024年02月11日
    浏览(51)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包