Question

我正在尝试从 TensorFlow Datasets 加载 coil100 数据集。根据文档，该数据集仅带有 train 拆分。我想在训练/测试中拆分数据集以便在本地播放，但是，即使在仔细阅读 TensorFlow 数据集文档后，我也遇到了很多问题。这是我的尝试：

import tensorflow_datasets as tfds

ds_train, ds_info = tfds.load(
'coil100',
split=['train'],
shuffle_files=True,
as_supervised=True,
with_info=True,

)

train = ds_train[0][0: 7000]
test = ds_train[0][7000:]

然而，它导致了这个错误：

TypeError: '_OptionsDataset' object is not subscriptable

我在理解某些数据集的准备方式时遇到了很多问题，因为返回的数据不可迭代，而且文档中并没有真正清楚地解释这一点。有没有其他资源可以让我最终理解如何处理这个库中的任何数据集？

Answer 1

请参阅 Tensorflow Datasets: Splits and Slicing 的文档。你需要的是这个：

tfds.load('coil100', split=['train[:7000]', 'train[7000:]'])

TensorFlow 数据集训练/测试拆分

1 个答案: