如何找到Imagenet数据标签?

时间:2016-11-22 14:38:53

标签: tensorflow deep-learning imagenet

我有两个关于如何加载Imagenet数据的问题。 我下载了ILSVRC2012验证集(原因训练集太大) 但我有两个问题。

  1. 我无法理解如何找到标签。 只有jpeg文件的文件名如" ILSVRC2012_val_00000001.JPEG"但是没有标签。我怎样才能找到它们?

  2. 据我所知,Imagenet使用224 * 224像素图像,问题只是"分类"不是"检测",但ILSVRC2012集具有更多不同的像素大小。那么,我怎样才能获得224 * 224像素的正确方框?

3 个答案:

答案 0 :(得分:5)

  1. 您将下载三个tar档案:一个用于培训数据,一个用于验证数据,另一个用于测试数据。

    培训数据包含在1000个文件夹中,每个类一个文件夹(每个文件夹应包含1,300个JPEG图像)。验证数据是包含50k JPEG个图像的单个文件夹,在(中提到的darren1231中需要单独下载它作为DevKit 的一部分)中查找相应的ILSVRC2012_validation_ground_truth.txt文件。

  2. 测试数据与验证数据类似,但它没有标签(不向您提供标签,因为您需要将预测标签提交给他们,作为竞赛的一部分)。

    1. ImageNet图像具有可变分辨率,平均为482x415,您可以根据自己的需要处理它们以训练模型。大多数人按如下方式处理:首先缩小每个图像的尺寸,使其较短边为256像素。然后裁剪一个随机的224x224补丁。使用这些补丁进行训练(每个时期你将得到不同的作物)。在测试期间,执行相同操作,但提取中心224x224补丁,并使用它来评估分类准确性。有些人还使用多个补丁进行测试。同样,这取决于你,如果你愿意,你可以使用更高的分辨率。

答案 1 :(得分:0)

确保从here下载并将每个文件.tar解压缩到每个类的synsent个文件夹中。这是你不混合照片的最佳方式。

答案 2 :(得分:0)

它位于开发套件中(任务1和2) 文件名为" ILSVRC2012_validation_ground_truth.txt"