图像中的自动菌群检测

时间:2012-10-18 12:17:10

标签: image-processing opencv machine-learning classification feature-extraction

我的图片数据集来自http://www.image-net.org。对于不同的事物,如植物群,动物群,人等,有各种各样的同义词 我必须训练一个分类器,如果图像属于花卉同义词,则预测1,否则为0。
通过单击左侧窗格中的植物,植物,植物生命选项,可以在http://www.image-net.org/explore查看属于花卉synset的图像。

这些图像包括各种各样的植物 - 如树木,草本植物,灌木,花卉等。 我无法弄清楚用于训练分类器的功能。这些图像中有很多绿色植物,但有许多花卉图像,没有太多的绿色成分。另一个特征是叶子和花瓣的形状。

如果有人可以建议如何提取此形状特征并使用它来训练分类器,那将会很有帮助。还建议可以使用哪些其他功能来训练分类器 并且在提取特征之后,将使用哪种算法来训练分类器?

2 个答案:

答案 0 :(得分:4)

不确定形状信息是您链接到的数据集的方法。

只需快速浏览一些图片,我就会有一些分类建议:

  1. 自然场景很少有直线 - 线检测
  2. 您可以打折其中包含“不自然”颜色的场景。
  3. 如果你想尝试更先进的东西,我会建议熵/模式识别之间的混合会形成一个好的分类器,因为自然场景有很多。
  4. 尝试模板匹配/形状匹配的叶子/花瓣会打破你的心脏 - 你需要使用更广泛的东西。
  5. 至于使用哪种分类器...我通常建议最初使用K-means,一旦你得到一些结果,就可以确定实施贝叶斯或神经网络的额外努力是否值得。

    希望这有帮助。

    吨。

    <强>扩展

    “不自然的颜色”可能是绿色和棕色之外的高度饱和的颜色。它们适用于探测自然场景,因为即使花朵位于其中心,绿色/棕色光谱中应该有约50%的场景。

    此外,直线检测应该在自然场景中产生很少的结果,因为直边在本质上是罕见的。在基本级别生成边缘图像,阈值,然后搜索线段(近似直线的像素)。

    熵需要一些机器视觉知识。您可以通过确定本地化的熵来逼近场景,然后对结果进行直方图编制here是一种类似的方法,您必须使用它。

    如果您要尝试进行模式识别,您可能希望在Machine Vision上进步,因为这是一个困难的主题,而不是您可以在代码示例中抛出的东西。一旦颜色和边缘信息(线)耗尽,我只会尝试将它们作为分类器来实现。

    如果这是商业应用程序,则应咨询MV专家。如果这是大学作业(除非是论文),颜色和边缘/线条信息应该绰绰有余。

答案 1 :(得分:0)

我认为,

HOOG功能几乎是这类问题的事实上的标准。他们有点参与计算(我不知道你在做什么环境)但功能强大。

一个更简单的解决方案,可能会让你启动并运行,取决于数据集的难度,是从图像中提取所有重叠的补丁,使用k-means(或任何你喜欢的)聚类它们,然后代表一个图像作为对诸如SVM的监督分类器的这组量化图像块的分布。你会惊讶地发现这样的事情经常发生,它至少应该提供一个有竞争力的基线。