这是一个抽象的问题。
我有一组来自某些人的28x28像素的图像,我想用每个编写它的人来标记该数据。我将如何贴标签以进行培训和测试?这是我的第一个神经网络,我很难找到适合自己特殊需求的任何教程。感觉像MNIST / EMNIST这样的大多数数据已经被标记了。
更多信息是我使用的是Python 3,而Keras带有Tensorflow后端。
答案 0 :(得分:0)
我假设您知道谁写了每个图像。这就是将信息(类标签)与每个图像相关联的问题。有几种方法可以做到这一点。两种常见方法是:
为每个班级(人)创建一个文件夹,然后将图像放入其中。
文件夹内容:
john/01.png
john/02.png
jane/03.png
susan/...
在这种情况下,图像可以全部放在一个文件夹中,然后使用专用的逗号分隔值文件包含
文件夹内容:
dataset.csv
images/01.png
images/02.png
images/03.png
images/....
dataset.csv内容:
filename,person
images/01.png,john
images/02.png,john
images/03.png,jane
...
如果您有要存储的每个文件的其他数据,则CSV方法很好。例如,可能相关的元数据,例如谁记录了文件,记录了什么时间,使用哪种设备,在什么位置等。
当然也可以将两者结合起来。