是否需要数据集组织图像分类?

时间:2018-08-03 19:53:39

标签: python tensorflow machine-learning keras classification

我目前正在开发一个程序,该程序可以通过机器学习进行二进制图像分类。我有一个标签列表和一个图像列表,我将它们用作输入,然后输入到Inception V3模型中。

以这种方式输入数据集是否适用于Inception V3体系结构?在将其输入模型之前是否有必要将带有标签文件夹的图像组织起来?

感谢您的帮助!

1 个答案:

答案 0 :(得分:2)

在您的示例中,您将所有图像存储在内存中。您只需调用model.fit(trainX, trainY)即可训练模型。无需将图像组织在特定的文件夹结构中。

您所指的是flow_from_directory()的{​​{1}}方法。这个对象将从目录中产生图像,并自动从文件夹结构中推断标签。在这种情况下,图像应按标签排列在一个文件夹中。由于ImageDataGenerator是生成器,因此应将其与ImageDataGenerator结合使用。

作为第三个选项,您可以编写自己的自定义生成器,该生成器同时生成图像和标签。如果您的标签结构比每个图像一个标签更复杂,建议您这样做。例如在多标签分类,对象检测或语义分割中,其中输出也是图像。自定义生成器也应与model.fit_generator()一起使用。