kaggle新赛:Bengali.AI 语音识别大赛赛题解析

这篇具有很好参考价值的文章主要介绍了kaggle新赛:Bengali.AI 语音识别大赛赛题解析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

kaggle新赛:Bengali.AI 语音识别大赛赛题解析,kaggle,比赛,人工智能干货,人工智能,kaggle,语音识别

赛题名称:Bengali.AI Speech Recognition

赛题链接:https://www.kaggle.com/competitions/bengaliai-speech

赛题背景

竞赛主办方 Bengali.AI 致力于加速孟加拉语(当地称为孟加拉语)的语言技术研究。Bengali.AI 通过社区驱动的收集活动众包大规模数据集,并通过研究竞赛为其数据集提供众包解决方案。孟加拉.AI语双管齐下的方法的所有结果,包括数据集和训练模型,都是开源的,供公众使用。

参赛者在本次竞赛中的工作可能会对世界上最流行但资源匮乏的语言之一的语音识别改进产生影响。参赛者还可以为解决语音识别的主要挑战之一(分布外泛化)提供急需的推动力。

赛题方向

语音识别

赛题任务

本次比赛的目的是从未分发的录音中识别孟加拉语语音。参赛者将构建一个基于第一个大规模众包 (MaCro) 孟加拉语语音数据集训练的模型,其中包含来自印度和孟加拉国的约24,000人提供的1,200小时的语音数据作为训练数据。测试集包含来自训练中不存在的 17 个不同域的样本。

参赛者可以使用第一个孟加拉语分发外语音识别数据集来改进孟加拉语语音识别。此外,参赛者提交的内容将是孟加拉语的首批开源语音识别方法之一。

评估指标

提交的结果将通过计算平均词错误率来进行评估,步骤如下:

  • WER 是为测试集中的每个实例计算的。

  • WER在域内取平均值,由句子中的单词数加权。

  • 域平均值的(未加权)平均值是最终分数。

此 Python 代码计算指标:

import jiwer  # you may need to install this library

def mean_wer(solution, submission):
    joined = solution.merge(submission.rename(columns={'sentence': 'predicted'}))
    domain_scores = joined.groupby('domain').apply(
        # note that jiwer.wer computes a weighted average wer by default when given lists of strings
        lambda df: jiwer.wer(df['sentence'].to_list(), df['predicted'].to_list()),
    )
    return domain_scores.mean()

assert (solution.columns == ['id', 'domain', 'sentence']).all()
assert (submission.columns == ['id',' sentence']).all()
  • 提交格式

提交文件应包含两列:id and sentence 。参赛者需要预测文件夹中每个记录的句子。

提交文件应包含标头并具有以下格式:

id,sentence
0f3dac00655e,এছাড়াও নিউজিল্যান্ড এ ক্রিকেট দলের হয়েও খেলছেন তিনি।
a9395e01ad21,এছাড়াও নিউজিল্যান্ড এ ক্রিকেট দলের হয়েও খেলছেন তিনি।
bf36ea8b718d,এছাড়াও নিউজিল্যান্ড এ ক্রিকেট দলের হয়েও খেলছেন তিনি।
...

数据描述

  • train/:训练集,包含数千个MP3格式的录音文件。

  • test/:测试集,包含来自18个不同领域的自发语音录音,其中17个领域与训练集不同。私有测试集中可能还包含公共测试集中不存在的领域。

  • examples/:每个测试集领域的示例录音。这些示例录音可能有助于构建对领域变化具有鲁棒性的模型。这些示例录音是代表性的,且不会出现在测试集中。

  • train.csv:训练集的句子标签。

  • id:每个实例的唯一标识符。对应于train/目录中的文件{id}.mp3。

  • sentence:录音的纯文本转录。你的目标是为测试集中的每个录音预测这些句子。

  • split:无论是train还是validvalid拆分中的注释已经过手动检查和更正,而train拆分中的注释仅通过算法进行了清理。valid样本通常具有比train样本更高质量的注释,但其他方面来自相同的分布。

  • sample_submission.csv:一个样本提交文件,格式正确。详情请参阅Evaluation页面。

时间安排

  • 2023年7月17日 - 开始报名。

  • 2023年10月10日 - 报名截止。

  • 2023年10月10日 - 团队合并截止。

  • 2023年10月17日 - 最终提交截止。

竞赛奖金

  • 第一名 - $12,000

  • 第二名 - $10,000

  • 第三名 - $10,000

  • 第四名 - $10,000

  • 第五名 - $8,000

关注下方【学姐带你玩AI】🚀🚀🚀

回复“比赛”获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!文章来源地址https://www.toymoban.com/news/detail-605189.html

到了这里,关于kaggle新赛:Bengali.AI 语音识别大赛赛题解析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 2022 年全国职业院校技能大赛高职组云计算赛项赛题解析-“私有云 赛项” 之 《私有云服务搭建》!!超详细!!

    目录 2022 年全国职业院校技能大赛高职组云计算赛项赛题解析-《私有云》 【任务 1】私有云服务搭建[10

    2024年02月05日
    浏览(57)
  • 2022 年全国职业院校技能大赛高职组云计算赛项赛题解析-“私有云 赛项” 之 《私有云运维开发》!!超详细!

    目录 【任务 3】私有云运维开发[10 分] 【题目 1】Ansible 服务部署:部署 MariaDB 集群[2 分]

    2024年02月08日
    浏览(30)
  • 2023年工业互联网(网络安全)赛题AI解析

    debian中设置root账户口令,开启口令复杂度检 查,至少包含小写字母、大写字母、数字、特殊字符4类字符,设置最小口令长度为8位,且新口令必须与旧口令有3位不同 要设置root账户口令并开启口令复杂度检查,您可以按照以下步骤进行操作: 打开终端,以root身份登录或者使

    2024年02月08日
    浏览(37)
  • 用AI攻克“智能文字识别创新赛题”,这场大学生竞赛掀起了什么风潮?

    中国大学生服务外包创新创业大赛作为服务外包产业领域唯一的国家级赛事,位列“全国普通高校学科竞赛排行榜评估体系”,自2010年以来已连续举办14届,分为区域赛和全国决赛两个阶段。本届大赛吸引了803所全国院校的8006支团队报名参赛,报名团队数再创新高。其中40

    2024年02月12日
    浏览(26)
  • 15 万奖金!开放原子开源大赛OpenAnolis 赛题@你报名

    8 月 29 日,2023 开源和信息消费大赛新闻发布会在北京召开,首届“开放原子开源大赛”正式启动报名。大赛由工业和信息化部、江苏省人民政府、湖南省人民政府共同主办,开源赛道拟由开放原子开源基金会、央视网、江苏省工业和信息化厅、无锡市人民政府、江苏软件产

    2024年02月05日
    浏览(38)
  • 2017年江西省电子专题大赛赛题剖析

    【题目要求】 简易数控直直流稳压电源 一、内容 参赛学生从赛场提供的元器中选取必要的一部分,设计并制作一个简易数控直流稳压电源。用轻触按键设置输出直流电压值,电压值用共阴数码管显示。 二、要求 1、基本部分 1)、用数码管显示当前直流电压值。上电后初始

    2024年02月01日
    浏览(30)
  • 语音识别系列︱用python进行音频解析(一)

    笔者最近在挑选开源的语音识别模型,首要测试的是百度的paddlepaddle; 测试之前,肯定需要了解一下音频解析的一些基本技术点,于是有此篇先导文章。 笔者看到的音频解析主要有几个: soundfile ffmpy librosa 安装代码: 参考文档:librosa 文档位置:https://librosa.org/doc/latest/co

    2024年02月02日
    浏览(33)
  • AI > 语音识别开源项目列举

    名称 所属开发机构 使用场景 优缺点 技术特点 占有率 描述 CMU Sphinx 卡内基梅隆大学 嵌入式设备、服务器应用 优点:可用于嵌入式设备和服务器应用。 缺点:准确率相对较低,适用范围有限。 - 支持多种语言模型和工具。- 适用于嵌入式设备和服务器应用。 中等 CMU Sphinx 是

    2024年02月15日
    浏览(68)
  • Ai语音机器人系统语音识别达到了什么水准

    AI语音机器人系统语音识别技术概述 AI语音机器人系统的语音识别技术主要依赖于深度学习算法,通过对大量语音数据进行训练,使得模型能够从语音信号中提取有效特征,从而实现高精度的语音识别。这一过程通常包括以下几个关键步骤:   语音采集 :通过麦克风等设备收

    2024年04月25日
    浏览(24)
  • 跟着我学习 AI丨语音识别:将语音转为数字信号

    语音识别是一种人工智能技术,其主要目的是将人类说话转化为计算机可以理解的信息。语音识别技术的应用非常广泛,包括智能家居、汽车导航、语音搜索、人机交互、语音翻译等。 语音识别的技术原理是将人类的语音信号转化为数字信号。这个过程包括信号的采样、量化

    2024年02月02日
    浏览(23)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包