如何在Tensorflow中使用现有数据集的一部分

时间:2017-11-07 04:01:36

标签: python tensorflow

我想在tensorflow resnet示例code中仅使用每类CIFAR10数据集的前10%。

在这种情况下,最简单的改变方法是什么?我不完全理解Tensorflow中的数据类...

1 个答案:

答案 0 :(得分:1)

每个类过滤数据集完全 10%可能有点毛茸茸,但如果您的目标只是在较小的数据集上尝试 ResNet,最简单的方法是skip数据集的90%,这会将每个类减少到10%。如果您没问题,只需添加skip after the shuffle call

...
dataset = dataset.shuffle(buffer_size=_SHUFFLE_BUFFER)
dataset = dataset.skip(54000)
...

..这将导致dataset跳过60000个示例中的90%并且仅返回6000个。