如何为卷积神经网络标记训练和测试数据?

时间:2019-04-13 17:45:04

标签: machine-learning neural-network conv-neural-network

这是一个抽象的问题。

我有一组来自某些人的28x28像素的图像,我想用每个编写它的人来标记该数据。我将如何贴标签以进行培训和测试?这是我的第一个神经网络,我很难找到适合自己特殊需求的任何教程。感觉像MNIST / EMNIST这样的大多数数据已经被标记了。

更多信息是我使用的是Python 3,而Keras带有Tensorflow后端。

1 个答案:

答案 0 :(得分:0)

我假设您知道谁写了每个图像。这就是将信息(类标签)与每个图像相关联的问题。有几种方法可以做到这一点。两种常见方法是:

文件夹结构

为每个班级(人)创建一个文件夹,然后将图像放入其中。

文件夹内容:

john/01.png
john/02.png
jane/03.png
susan/...

CSV文件

在这种情况下,图像可以全部放在一个文件夹中,然后使用专用的逗号分隔值文件包含

文件夹内容:

dataset.csv
images/01.png
images/02.png
images/03.png
images/....

dataset.csv内容:

filename,person
images/01.png,john
images/02.png,john
images/03.png,jane
...

如果您有要存储的每个文件的其他数据,则CSV方法很好。例如,可能相关的元数据,例如谁记录了文件,记录了什么时间,使用哪种设备,在什么位置等。

当然也可以将两者结合起来。