在tensorflow中,为什么slim.data.set.Dataset需要`num_samples`?有没有办法在不知道`num_samples`的情况下使用它?

时间:2017-05-25 19:06:24

标签: tensorflow

我正在使用slim.dataset.Dataset示例尝试TFrecords。

slim.dataset.Dataset(
        data_sources=file_pattern,
        reader=reader,
        decoder=decoder,
        num_samples=SPLITS_TO_SIZES[split_name],
        items_to_descriptions=ITEMS_TO_DESCRIPTIONS,
        num_classes=NUM_CLASSES,
        labels_to_names=labels_to_names)

稍后我将在

中使用它
provider = dataset_data_provider.DatasetDataProvider(dataset, shuffle=False)

我想知道为什么数据集需要num_samples。例如,如果一个人提供了预先编译的 kitti_val.tfrecord 该怎么办?

从KITTI数据集定义中,我可以设置其他参数,例如num_classeslabels_to_names等。但是,我可能不知道val拆分会有多少样本有(可能是训练集的10%或20%。)

此外,我猜测num_samples可能在内部计算,并且是确定性的。

有没有办法在不知道num_samples的情况下使用预先编译的tfrecord?

0 个答案:

没有答案