ImageNet官网上的数据集,动辄就100G,真的是太大了。
有需要Tiny Image Net 数据集的小伙伴可以点击这个下载链接:
http://cs231n.stanford.edu/tiny-imagenet-200.zip
数据集简介:
Tiny ImageNet Challenge 来源于斯坦福 CS231N 课程,共237M
Tiny Imagenet 有 200 个类。 每个类有 500 张训练图像、50 张验证图像和 50 张测试图像。
关于tiny image net的val部分,我们需要做一些修改,让val部分和train一样,同一类别的图片,都放到同一个文件夹下,并且类别名和train文件夹下的类别名称一样
具体的连接如下:
https://www.cnblogs.com/liuyangcode/p/14689893.html
补充几个小数据集:
花卉数据集
数据集下载地址:http://m6z.cn/6rTT7n
该数据集包含 4242 张花卉图像。数据收集基于数据flicr、google images、yandex images。此数据集可用于从照片中识别植物。数据图片会分为五类:洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每个种类大约有800张照片。照片分辨率不高,约为 320x240 像素。照片不会缩小到单一尺寸,它们有不同的比例。
综合汽车数据集
数据集下载地址:http://m6z.cn/6rTTar
该数据集是被CVPR 2015 论文“用于细粒度分类和验证的大规模汽车数据集”所使用的。综合汽车 (CompCars) 数据集包含来自两个场景的数据,包括来自网络自然和监视自然的图像。web-nature 数据包含 163 个汽车制造商和 1,716 个汽车型号。总共有 136,726 张拍摄整车的图像和 27,618 张拍摄汽车零件的图像。完整的汽车图像标有边界框和视点。每个车型都标有五个属性,包括最大速度、排量、门数、座位数和汽车类型。监控性质的数据包含在前视图中捕获的 50,000 张汽车图像。
90种动物图像数据集
数据集下载地址:http://m6z.cn/6rTTbJ
在这个数据集中有 90 个不同类别的 5400 张动物图像。此数据集是从 Google 图片创建的:https://images.google.com/。所有照片将按照其所属类别存放于各自的文件夹下。动物类别包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲虫,野牛,公猪,蝴蝶,猫 毛虫,黑猩猩等。该数据集中的图像大小不固定,可能需要后续的处理。
衣服数据集
数据集下载地址:http://m6z.cn/64EPUp
衣服数据集总共收集了 20 种衣服的 5,000 张图像。该数据集是根据公共领域许可 (CC0) 发布的。我们使用了三种不同的方式来收集数据集:Toloka——众包平台;社交媒体上的网络众包计划;Tagias——一家专门从事数据收集的公司。标签是使用 IPython 小部件手动完成的,同时我们使用简单的神经网络纠正了标签错误。
数据集包含 20 个类,包括T 恤(1011 件),长袖(699 件),裤子(692 件),鞋子(431 件)衬衫(378 件),连衣裙(357 件),外套(312 件),短裤(308 件),帽子(171 件),裙子(155 件),西装外套(109 件)等。
飞机数据集
数据集下载地址:http://m6z.cn/5X8CPy
数据集包含 10,000 张飞机图像,数据分为 3334 个训练图像、3333 个验证图像和 3333 个测试图像。
商标数据集
数据集下载地址:http://m6z.cn/6cb2HG
文章来源:https://www.toymoban.com/news/detail-407880.html
在这项工作中,我们构建了一个大规模的 logo 数据集 Logo-2K+,它涵盖了来自真实世界 logo 图像的各种 logo 类别。我们生成的徽标数据集包含 167,140 张图像,具有 10 个根类别和 2,341 个类别。文章来源地址https://www.toymoban.com/news/detail-407880.html
到了这里,关于Tiny ImageNet 数据集分享的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!