我正在使用slim.dataset.Dataset示例尝试TFrecords。
slim.dataset.Dataset(
data_sources=file_pattern,
reader=reader,
decoder=decoder,
num_samples=SPLITS_TO_SIZES[split_name],
items_to_descriptions=ITEMS_TO_DESCRIPTIONS,
num_classes=NUM_CLASSES,
labels_to_names=labels_to_names)
稍后我将在
中使用它provider = dataset_data_provider.DatasetDataProvider(dataset, shuffle=False)
我想知道为什么数据集需要num_samples。例如,如果一个人提供了预先编译的 kitti_val.tfrecord 该怎么办?
从KITTI数据集定义中,我可以设置其他参数,例如num_classes
,labels_to_names
等。但是,我可能不知道val
拆分会有多少样本有(可能是训练集的10%或20%。)
此外,我猜测num_samples
可能在内部计算,并且是确定性的。
有没有办法在不知道num_samples
的情况下使用预先编译的tfrecord?