多篇论文入选ICASSP 2023,火山语音有效解决多类实践问题

这篇具有很好参考价值的文章主要介绍了多篇论文入选ICASSP 2023,火山语音有效解决多类实践问题。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

近日由IEEE主办、被誉为世界范围内最大规模、也是最全面的信号处理及其应用方面的顶级学术会议ICASSP2023于希腊召开,该会议具有权威、广泛的学界以及工业界影响力,备受AI领域多方关注。会上火山语音多篇论文被接收并发表,内容涵盖众多前沿领域的技术创新,并有效解决了字音转换、语种混淆等实践问题。

多篇论文入选ICASSP 2023,火山语音有效解决多类实践问题

图片来源:https://2023.ieeeicassp.org/

LiteG2P:一种快速、轻量级、高精度的字音转换模型(LiteG2P: A Fast, Light and High Accuracy Model for Grapheme-to-Phoneme Conversion )

研究背景: 众所周知,字音转换(G2P)旨在将单词转换为其对应的发音表示,通常被广泛应用于语音识别(ASR)及语音合成(TTS)等语音任务中,但现有方法中基于规则的方法预测精度往往较差,还需要大量专家经验的辅助;其中基于数据驱动的深度模型方案虽然精度高,但模型尺寸往往较大且计算效率偏低。对此,火山语音团队提出了一种高效快速、轻量级、高精度的字音转换模型,可进一步适用于多类端侧设备。

方法分析: LiteG2P结合数据驱动和知识驱动的优势,得以在控制模型尺寸较小的同时取得较高精度,模型层面上不同于传统的基于注意力机制的序列到序列预测模型,而是采用CTC损失进行字音的对齐,同时使得模型具备了并行预测音素序列的优势;除此之外,火山语音团队还额外引入了语言知识词典,用以指导字母扩展长度以及缩小目标预测音素集合。

多篇论文入选ICASSP 2023,火山语音有效解决多类实践问题

The architecture of LiteG2P

效果呈现: 最终LiteG2P模型相较于主流基线模型具有高精度、并行化、轻量级、快速等优势,与主流基线模型在准确率相当的同时速度提升30倍以上,参数量小10倍以上;可一套模型架构同时部署在端云多种类型设备上,在端侧设备上单个单词的推理速度预测为5ms以内,云端设备2ms以内文章来源地址https://www.toymoban.com/news/detail-474937.html

到了这里,关于多篇论文入选ICASSP 2023,火山语音有效解决多类实践问题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ICASSP 2023

    On behalf of our whole Organizing Committee, it is our great pleasure  to invite you to the 2023 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2023), which will take place in the Greek island of Rhodes from June 04 to June 09, 2023. The flagship conference of the IEEE Signal Processing Society (SPS) will be held in-person

    2024年02月09日
    浏览(36)
  • ICASSP 2023 | MCROOD: MULTI-CLASS RADAR OUT-OF-DISTRIBUTION DETECTION

    原文链接:https://mp.weixin.qq.com/s?__biz=Mzg4MjgxMjgyMg==mid=2247486484idx=1sn=d43f92ca0230753e77f54557054653d6chksm=cf51beedf82637fb27d4cbb9279f273298779dabe25f7775cb93469787bcc12c1b6b2caec979#rd 无线感知论文阅读笔记:ICASSP 2023, MCROOD: MULTI-CLASS RADAR OUT-OF-DISTRIBUTION DETECTION Abstract 0.25 page 目标 针对雷达range-doppler im

    2024年02月15日
    浏览(62)
  • 两篇2023 ICLR多模态论文分享(模态互补性对多模态鲁棒性影响 与 对多模表示学习有效的单模学习)

    本文讨论了模态互补性在多模态鲁棒性中的重要性,并基于信息论提出了一种数据集层面量化度量,用于量化不同模态之间有多少互补信息,以及这些信息对预测标签有多大贡献。该指标基于互信息神经估计器(MINE)来计算。提出了一个两阶段pipeline,分成数据生成阶段和度

    2024年02月08日
    浏览(41)
  • 迈向通用听觉人工智能!清华电子系、火山语音携手推出认知导向的听觉大语言模型SALMONN

    日前,清华大学电子工程系与火山语音团队携手合作,推出认知导向的开源听觉大语言模型SALMONN (Speech Audio Language Music Open Neural Network)。 大语言模型 SALMONN LOGO 相较于仅仅支持语音输入或非语音音频输入的其他大模型,SALMONN对语音、音频事件、音乐等各类音频输入都具有感知

    2024年02月12日
    浏览(62)
  • AttributeError: module ‘numpy‘ has no attribute ‘ndarray‘(最新版解决,综合多篇)

    1.进入你 所在环境,分别卸载掉原有的 numpy与pandas 2. 重新安装numpy与pandas,记住先安装numpy,然后安装pandas。 语句1:pip install numpy==1.21.5 -i https://pypi.tuna.tsinghua.edu.cn/simple some-package 语句2:pip install pandas==1.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple some-package

    2024年02月12日
    浏览(89)
  • 云起无垠典型案例入选《2023软件供应链安全洞察》报告

    近日,历时6个月,由ISC编制的《2023软件供应链安全洞察》报告(以下简称《报告》)正式对外发布。《报告》围绕软件供应链安全现状、技术内核、治理指南、落地实践展开,以期为行业从业者提供有价值的信息和洞见,帮助整个行业在应对软件供应链安全挑战的道路上迈

    2024年02月07日
    浏览(46)
  • 一级分类全覆盖!安全狗入选《嘶吼2023网络安全产业图谱》

    7月10日 ,嘶吼安全产业研究院联合国家网络安全产业园区(通州园)正式发布 《嘶吼2023网络安全产业图谱》 。作为 国内 云原生安全领导厂商 , 安全狗 入选图谱中的多个细分领域。 据悉,本次《嘶吼2023网络安全产业图谱》采用了市场调研、数据精析、文献研究及政策参

    2024年02月17日
    浏览(46)
  • 中国工科研究生200多篇英文论文中最常见的习惯(The Most Common Habits from more than 200 English Papers written by Gradua)

    原文地址:http://staff.ustc.edu.cn/~jpq/writing/The%20Most%20Common%20Habits.pdf 本文介绍了中国作家在200多篇英语科技论文中观察到的一些最常见的汉英习惯。这些习惯会被解释,在大多数情况下,来自实际论文的示例文本会与首选文本一起给出。试图解释如何纠正和防止此类错误。在某

    2024年02月08日
    浏览(44)
  • 智汇云舟入选IDC《中国智慧城市数字孪生技术评估,2023》报告

    nbsp; nbsp; nbsp; nbsp;8月7日,国际数据公司(IDC)发布了《中国智慧城市数字孪生技术评估,2023》报告。智汇云舟凭借在数字孪生领域的创新技术与产品,入选《2023中国数字孪生城市技术提供商图谱》。 nbsp; nbsp; nbsp; nbsp;报告通过公开征集的形式进行申报,经专家评审、实际调

    2024年02月13日
    浏览(43)
  • 2023年郑州重点建设项目名单公布,中创“算力数据中心”项目入选!

    4月7日,郑州市人民政府网站公布2023年郑州市重点建设项目名单,名单共列项目680个,总投资1.08万亿元,年度计划投资2691亿元。 在创新驱动能力提升项目名单里,中创算力与人民网·人民数据(国家大数据灾备中心)合作共建的“算力数据中心”项目入选郑州市重点项目名

    2023年04月14日
    浏览(73)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包