基于EasyDL搭建音频在线实时分类系统

这篇具有很好参考价值的文章主要介绍了基于EasyDL搭建音频在线实时分类系统。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

搭建音频在线实时分类系统

本人基于自我学习目的搭建了生猪音频实时分类系统,使用百度 EasyDL 零门槛AI开发平台训练音频分类模型,然后发布为公有云在线服务;之后使用 javascript + axios + wavesurfer 搭建前端展示界面用来展示实时分类的效果。

1. easydl 训练音频分类模型

1.1 上传数据并训练音频分类模型
    1. 打开 easydl 官网:https://ai.baidu.com/easydl,点击立即使用,选择模型类型为声音分类。
      基于EasyDL搭建音频在线实时分类系统
    1. 进入声音分类界面后,点击模型中心的创建模型,填写需要创建的相关信息。

基于EasyDL搭建音频在线实时分类系统

    1. 在 EasyData 数据服务中的数据总览中点击创建数据集,并给定数据集名称。

基于EasyDL搭建音频在线实时分类系统

    1. 在数据总览中该数据集中点击导入按钮导入数据集,并按照要求导入有标注信息的压缩包数据。

基于EasyDL搭建音频在线实时分类系统

    1. 数据要求:以文件夹命名分类,一个文件夹下就是一类数据,文件夹名就是该类别名,其中单个音频文件时长需要超过1秒。
      例如:文件夹1命名为的 pig_eat 其中文件全为猪吃食叫声,文件夹2命名为的 pig_howl 其中文件全为猪嚎叫声。

基于EasyDL搭建音频在线实时分类系统

    1. 查看数据是否导入成功并识别出有标记信息,未标记成功的数据可以在线进行重新标注。

基于EasyDL搭建音频在线实时分类系统

    1. 点击模型中心的训练模型,选择刚刚创建的模型和数据集,训练方式选择公有云部署。然后点击开始训练进行模型训练。

基于EasyDL搭建音频在线实时分类系统

    1. 在模型中心的我的模型中可以看到训练的结果。

基于EasyDL搭建音频在线实时分类系统

1.2 发布训练好的模型
    1. 点击公有云在线服务,选择发布新服务,填写api地址,将刚刚训练好的模型进行发布。
    1. 进入网址 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/app/list 中创建应用。
    1. 进入网址 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/overview/index 配置公有云部署相关参数。
    1. 参考文档 声音分类模型如何发布为API,声音分类API调用文档,token鉴权认证机制

2. 前端部署

  1. 下载代码 https://gitee.com/qiaoyukeji/pigAuido_reco_show

  2. 替换API Key等后浏览器访问以下链接
    注意:将 https://console.bce.baidu.com/ai/#/ai/easydlLiteVoice/app/list 中的 API Key 和 Secret Key填入下面的client_id 和client_secret后面

https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=ABC&client_secret=ABC

基于EasyDL搭建音频在线实时分类系统

  1. 将上图 access_token 的一串数字填入替换 index.js 中第52行的access_token处即可。

  2. 前端界面展示

基于EasyDL搭建音频在线实时分类系统


本文首发于本人博客:https://blog.gitnote.cn/post/pigAuido_reco_show/

版权信息: CC BY-NC-SA 4.0 (自由转载-非商用-相同方式共享-保持署名)文章来源地址https://www.toymoban.com/news/detail-413075.html

到了这里,关于基于EasyDL搭建音频在线实时分类系统的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基于SpringBoot的在线拍卖系统【附ppt和万字文档(Lun文)和搭建文档】

    主要功能 前台登录: ①首页:轮播图、竞拍公告、拍卖商品展示 ②拍卖商品:分类:手机、数码、电器等,可以点击商品竞拍 ③竞拍公告:可以查看竞拍的信息 ④留言反馈:用户可以提交留言 ⑤个人中心:可以更新自己相关的信息 后台登录: ①主页、个人中心:修改密

    2024年02月11日
    浏览(21)
  • Dotnet工具箱:开源、免费的纯前端工具网站,带你探索10大工具分类和73个实时在线小工具

    大家好,我是沙漠尽头的狼。 Dotnet工具箱是一个纯前端的、开源和免费的工具网站,周末我参考了开源项目it-tools,对网站界面文字进行了汉化,并重新部署了网站。该网站共有10大工具分类,提供了73个实时在线小工具。使用Vue3开发的Dotnet工具箱具有独特的特色,本文详细

    2024年02月08日
    浏览(35)
  • IM即时通讯源码/im源码基于uniapp框架从0开始设计搭建在线聊天系统

    随着人社交产品的不断发展,即时通讯聊天这门技术也越来越重要,很多人都开启了学习通讯技术,本文就介绍了即时通讯的基础内容。 在开始设计和搭建聊天系统之前,需要确定所需技术栈。常用的技术栈包括前端、后端和数据库。例如,前端可以选择uni-app,后端可以选

    2024年02月04日
    浏览(41)
  • 基于Whisper语音识别的实时视频字幕生成 (二): 在线实时字幕

    Whistream(微流)是基于Whisper语音识别的的在线字幕生成工具,支持rtsp/rtmp/mp4等视频流在线语音识别 whistream将在whishow基础上引入whisper进行在线语音识别生成视频字幕 python: 命令行: 在线直播字幕: 605686962@qq.com coolEphemeroptera@gmail.com

    2024年04月13日
    浏览(38)
  • 基于vue+websocket实现web端的实时pcm音频播放

    pcm-player是一个JavaScript库,用于在浏览器中播放PCM音频文件。PCM是一种数字音频编码格式,它将模拟音频信号转换为数字信号。在Vue中使用PCMPlayer可以让你在Web应用中轻松处理音频播放。 安装pcm-player 在Vue组件中引入PCMPlayer 在你的Vue组件中,你需要引入PCMPlayer库。你可以在组

    2024年04月09日
    浏览(73)
  • 【Microsoft Azure 的1024种玩法】二十八. 基于Azure Cloud搭建IPS入侵防御系统实现安全流量实时分析

    Snort 是一个开源入侵防御系统(IPS),Snort IPS 使用一系列规则来帮助定义恶意网络活动,并利用这些规则来查找与之匹配的数据包,并为用户生成警报,Snort 也可以在线部署来阻止这些数据包。Snort有三个主要用途。作为一个像tcpdump一样的数据包嗅探器,作为一个数据包记录

    2024年02月04日
    浏览(31)
  • 在线餐饮油烟实时监测系统的设计与实现

    安科瑞 华楠 摘 要: 为了解决传统油烟检测方法中成本高、效率低、实时性差等问题,设计开发了一种在线油烟实时监测系统;系统由采集、通讯、服务器和用户交互四个模块组成;采集模块采集油烟数据,通过GPRS通讯技术将数据发送至服务器;数据在服务器中按照解码规

    2024年02月14日
    浏览(23)
  • 自动化实时在线静电监控系统的构成

    自动化实时在线静电监控系统是一种帮助企业监测和管理静电问题的技术解决方案。静电在许多工业和商业环境中都是一个潜在的风险和生产问题。通过使用这样的监控系统,企业可以及时发现并采取对策来预防或减轻可能的静电问题。 该系统通常由以下组成部分构成: 1

    2024年02月10日
    浏览(34)
  • 基于Whisper语音识别的实时视频字幕生成 (一): 流式显示视频帧和音频帧

    Whistream(微流)是基于Whisper语音识别的的在线字幕生成工具,支持rtsp/rtmp/mp4等视频流在线语音识别 whishow(微秀)是python实现的在线音视频流播放器,支持rtsp/rtmp/mp4等流式输入,也是whistream的前端。python实现原理如下: (1) SPROCESS.run() 的三个子线程负责:缓存流数据,处理音

    2024年04月13日
    浏览(40)
  • 【Transformer论文】CMKD:用于音频分类的基于 CNN/Transformer 的跨模型知识蒸馏

    文献题目:CMKD: CNN/Transformer-Based Cross-Model Knowledge Distillation for Audio Classification 文献时间:2022 音频分类是一个活跃的研究领域,具有广泛的应用。 在过去十年中,卷积神经网络 (CNN) 已成为端到端音频分类模型的事实上的标准构建块。 最近,仅基于自注意力机制(如音频频谱

    2023年04月17日
    浏览(26)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包