网站目前提供约 70 个最新数据集,涵盖了计算机视觉、自然语言理解和音频三大领域。
还在愁到哪里找到需要的机器学习数据集吗?
每年都有很多大型、高质量的数据集发布,其中大多数数据集都发布在各自的网站上,通过谷歌搜索很难找到所有这些数据集。
现在,一位名叫 Nikola Pleša 的开发人员做了一个项目,将所有机器学习的大型数据集收集在一个网站上,方便大家取用。
网站一经发布,好评如潮。网站目前提供约 70 个数据集,涵盖了计算机视觉、自然语言理解和音频三大领域,包括每个数据集的链接、简介、许可类型、论文等,并且作者表示将继续增加数据集数量。
传送门:
https://www.datasetlist.com/
下面,我们分别介绍 CV、NLP 的最新 10 大数据集,以及 4 个音频数据集。
计算机视觉(46个)
1. IBM 人脸多样性数据集文章来源:https://www.toymoban.com/news/detail-829051.html
IBM 的人脸多样性 (DiF) 数据集是一个庞大而多样化的数据集,旨在促进人脸识别技术中公平性和准确性的研究。DiF 是第一个此类数据集,包含 100 文章来源地址https://www.toymoban.com/news/detail-829051.html
到了这里,关于【架构】全网最大机器学习数据集,视觉、NLP、音频大汇集的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!