我正在尝试用Python开发一个程序,该程序可以识别流程图图像文件。结果应为:yes this is a flowchart
或no this is not a flowchart
。
我看过一个视频系列,对猫和狗的图像进行了分类。有两个类别作为数据集,狗和猫。但是我只有一个类别flowcharts
。如何将流程图图像与所有其他东西分开?
答案 0 :(得分:0)
在这两种情况下,您都有两个类:猫/狗和流程图/不是流程图,因此您可以尝试对这两个类应用相同的原理。
要检测流程图,您还可以尝试识别图像中的特征图案,例如线条,矩形或图像中的文字。
这可能会导致更好的结果,并且不需要像深度学习那样庞大的训练数据集。这是一个太宽泛的主题,无法在此处给出完整的答案,但是我鼓励您朝这个方向发展。
答案 1 :(得分:0)
这是一个很难解决的问题,因为问题空间很大。基本上,您有两种可能的分类-“流程图”和“非流程图”。困难的部分是“非流程图”。您将需要一个庞大的图像训练数据集,而不是流程图,以获得甚至不错的结果。一方面,获取这样的训练数据集很容易,因为您只需要一堆随机图像。另一方面,这将需要大量的培训时间,会占用大量的存储空间,并且您可能仍无法达到所需的精度。