TensorFlow 数据集训练/测试拆分

时间:2020-12-21 10:14:01

标签: python tensorflow keras tensorflow2.0 tensorflow-datasets

我正在尝试从 TensorFlow Datasets 加载 coil100 数据集。根据文档,该数据集仅带有 train 拆分。我想在训练/测试中拆分数据集以便在本地播放,但是,即使在仔细阅读 TensorFlow 数据集文档后,我也遇到了很多问题。这是我的尝试:

import tensorflow_datasets as tfds

ds_train, ds_info = tfds.load(
'coil100',
split=['train'],
shuffle_files=True,
as_supervised=True,
with_info=True,

)

train = ds_train[0][0: 7000]
test = ds_train[0][7000:]

然而,它导致了这个错误:

TypeError: '_OptionsDataset' object is not subscriptable

我在理解某些数据集的准备方式时遇到了很多问题,因为返回的数据不可迭代,而且文档中并没有真正清楚地解释这一点。有没有其他资源可以让我最终理解如何处理这个库中的任何数据集?

1 个答案:

答案 0 :(得分:2)

请参阅 Tensorflow Datasets: Splits and Slicing 的文档。你需要的是这个:

tfds.load('coil100', split=['train[:7000]', 'train[7000:]'])