enter image description here我在一个文件夹中有3000张用于训练和测试的图像,并且我在label.csv文件中也有图像标签,该文件具有五个类别。谁能帮助我如何将这个数据集分为训练和测试数据,以便我可以使用卷积神经网络对图像进行分类。与csv和图像链接后,我的数据集如下图所示。
答案 0 :(得分:0)
首先,您需要在图像和标签之间建立关联(某种知识属于哪个图像属于哪个图像)。否则它将无法正常工作。之后,您可以拆分数据集。这是一个玩具示例,假设full_dataset
包含整个数据集,而SIZE_OF_DATASET
的大小为full_dataset
:
full_dataset = full_dataset.shuffle()
train_dataset = full_dataset.take(int(0.8*SIZE_OF_DATASET))
test_dataset = full_dataset.skip(int(0.2*SIZE_OF_DATASET))