TensorFlow中的自定义数据集

时间:2019-10-11 06:02:37

标签: python tensorflow machine-learning tensorflow-datasets

我有一些图像及其各自的标签作为训练集。

我想将其用作TensorFlow中的数据集(因为我们使用mnist数据集,并可以使用mnist.train.next_batch(BATCH_SIZE)批量获取数据)

问题是,如何创建自己的数据集以便可以批量使用?

其他信息: 训练集包含4575张28 x 28(缩放)的图像和分类标签。总共有62个课程。

Data_Info

请让我知道是否需要更多信息。

1 个答案:

答案 0 :(得分:1)

您可以使用tf.data.from_tensor_slices(tf.convert_to_tensor(np_images), tf.convert_to_tensor(np_labels))创建由(图像,标签)对组成的数据集。现在,您可以对此应用.batch(BATCHSIZE)函数,这将创建所需大小的批次。 然后,如果使用.fit(),则可以直接将其馈送到tf.keras之类的模型函数中。

有关更多信息,请访问以下链接-

from_tensor_slices

convert_to_tensor

batch