识别数据集中的模式

时间:2018-10-17 07:47:10

标签: python classification image-recognition

我有一个要排序的图像数据集。许多图像只是我不需要的随机噪声,但是其中一些包含我想进一步处理的图案。

这里是一个示例: enter image description here

在这里,图案看起来像线条。我只需要保留包含某种图案的图片有哪些可能性?

1 个答案:

答案 0 :(得分:0)

您遇到分类问题(结构与噪声)。正如某些人在评论中所说,这是一个非常模糊和广泛的问题,就像图像处理或模式识别课程中的一个起始问题。但是,假设您没有相关主题的背景,我将尝试解释它如何工作。

首先,您需要从图像中获取一些特征或参数,然后确定特征值与嘈杂图像和结构化图像之间的关系。

实际上,您需要读取图像文件并将其转换为值,以便对其进行处理并尝试使用分类方法。

这是一个可能成功或失败的示例:

如您提供的图像所示,您的图像是黑白的,并且假设在导入它们之后,它们的值从0(黑色)到255(白色)。假设它们是40 x 40像素,我认为一个简单的功能就是像素值的平均值。

我看到图案是白线,所以我要说这些图像的平均值将高于没有白色像素的嘈杂图像的平均值。然后,您会发现嘈杂图像的平均值例如可以为[110、100、112、98],带有图案的图像的平均值可以为[130、135、125、131]。在这种情况下,您可以使用阈值作为分类方法。例如,如果平均值大于125,则认为该图像包含图案,否则为噪点。

如果使用平均值不足以区分类别,则应使用更详细的功能,在这种情况下,您需要使用一些图像处理,机器学习或其他可能满足您要求的方法