我的问题是关于如何为机器学习创建带标签的图像数据集?
我一直在使用已经存在的数据集,因此我在如何标记图像数据集方面面临困难(就像我们在猫与狗分类中一样)。
我必须做标签以及图像分割,在互联网上搜索后,我发现了一些手动标签工具,例如 LabelMe 和 LabelBox 。LabelMe很好,但是它以XML文件的形式返回输出。
现在我再次关心的是如何将XML文件输入到神经网络中?我一点都不擅长图像处理任务,因此我需要一个替代建议。
编辑:我已经扫描了学位证书和普通文档的副本,我必须创建一个分类器,将学位证书分类为1,将非学位证书分类为0。所以我的标签应该是:
学位证书-> y(1)
非学位证书-> y(0)
答案 0 :(得分:1)
您不将XML文件提供给神经网络。您可以使用XML解析器对其进行处理,然后使用该解析器提取标签。有关问题的解决方法,请参见问题How do I parse XML in Python?。
图像数据集可以有多种初始状态。例如,有时图像位于代表其类别的文件夹中。如果您想使用这种方法,那么与其在每次培训时都直接读取XML文件,不如使用它来以您喜欢或习惯的形式创建数据集。您在网上找到许多不错的现成数据集的原因是因为其他人确实做到了这一点。这是值得做的,因为您不必再重复从原始数据进行的所有转换就可以开始训练模型。
例如,从LabelMe收集XML数据,然后使用简短脚本读取XML文件,提取先前使用ElementTree输入的标签,然后将图像复制到正确的文件夹中。最后,您将获得一个数据集,该数据集包含两个带有正负匹配图像的文件夹,可以使用您喜欢的CNN图像处理包进行处理。