Stanford Cars Datasets
-
Overview:
Stanford Cars数据集简称CARS196,由斯坦福大学—人工智能实验室于2013年发布,主要用于细粒度分类任务。 数据集包含196中汽车类型的图像,16185张不同型号的汽车图片,其中8144张为训练集,8041张为测试集。每个类别的图像相当,其中分类基于汽车品牌、车型和年份,例如:2012特斯拉Model S、2012 BMW M3 coupe。
- Download:
下载网址:https://ai.stanford.edu/~jkrause/cars/car_dataset.html
训练集图片下载:car_train.gz
测试集图片下载:car_test.gz
开发工具包devkit:car_devkit.gz
所有图片的tar文件:car_ims.gz
用于训练和测试的所有边框和标签:cars_annos_mat
README提供了有关汽车196数据集的文件的描述:
- cars_meta.mat:
包含类名称的单元格数组,每个类一个。 - cars_train_annos.mat:
包含变量“ annotations”,它是长度为num_images的结构数组,其中每个元素都具有字段:
bbox_x1:边界框的最小x值,以像素为单位
bbox_x2:边界框的最大x值,以像素为单位
bbox_y1:边界框的最小y值,以像素为单位
bbox_y2:边界框的最大y值,以像素为单位
class:图像所属类的id。
fname:图像文件夹中的图像文件名。
“ annotations”变量中包含我们想要的结构数据,包括标签、图像文件名以及图像边界框信息,因此我们只需处理annotations变量并从中提取我们想要的信息 - cars_test_annos.mat:
与cars_train_annos.mat相同,但未提供class字段。
提交文件格式:
- 要提交的文件应该是.txt文件,第M行上为图像M的类别预测。 请注意,图像M对应于提供的注释文件中的第M个注释。 这种格式的文件示例是train_perfect_preds.txt。
- devkit中包括一个用于评估训练准确性的脚本eval_train.m。 用法是:
(in MATLAB)[accuracy,confusion_matrix] = eval_train('train_perfect_preds.txt')
假设训练预测和测试预测是相同的格式,那么你在训练预测时使用这种函数,在评估服务器下测试预测应该有很好的结果
- Evaluation:
设置了评估服务器,按照deckit中包含有关提交格式的说明提交文件,即可评估。
- Citation:
如果使用此数据集,引用以下论文:
3D Object Representations for Fine-Grained Categorization
Jonathan Krause, Michael Stark, Jia Deng, Li Fei-Fei
4th IEEE Workshop on 3D Representation and Recognition, at ICCV 2013 (3dRR-13). Sydney, Australia. Dec. 8, 2013.文章来源:https://www.toymoban.com/news/detail-468679.html
注意:发布数量具有196个类别,比论文少一类,因为自发布以来已经对其进行了一些请理。数字应该或多或少具有可比性。文章来源地址https://www.toymoban.com/news/detail-468679.html
到了这里,关于Stanford Cars Datasets的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!