我正在尝试从 TensorFlow Datasets 加载 coil100 数据集。根据文档,该数据集仅带有 train
拆分。我想在训练/测试中拆分数据集以便在本地播放,但是,即使在仔细阅读 TensorFlow 数据集文档后,我也遇到了很多问题。这是我的尝试:
import tensorflow_datasets as tfds
ds_train, ds_info = tfds.load(
'coil100',
split=['train'],
shuffle_files=True,
as_supervised=True,
with_info=True,
)
train = ds_train[0][0: 7000]
test = ds_train[0][7000:]
然而,它导致了这个错误:
TypeError: '_OptionsDataset' object is not subscriptable
我在理解某些数据集的准备方式时遇到了很多问题,因为返回的数据不可迭代,而且文档中并没有真正清楚地解释这一点。有没有其他资源可以让我最终理解如何处理这个库中的任何数据集?
答案 0 :(得分:2)
请参阅 Tensorflow Datasets: Splits and Slicing 的文档。你需要的是这个:
tfds.load('coil100', split=['train[:7000]', 'train[7000:]'])