应用错误收集

图像中的自动菌群检测

时间：2012-10-18 12:17:10

标签： image-processing opencv machine-learning classification feature-extraction

我的图片数据集来自http://www.image-net.org。对于不同的事物，如植物群，动物群，人等，有各种各样的同义词我必须训练一个分类器，如果图像属于花卉同义词，则预测1，否则为0。
通过单击左侧窗格中的植物，植物，植物生命选项，可以在http://www.image-net.org/explore查看属于花卉synset的图像。

这些图像包括各种各样的植物 - 如树木，草本植物，灌木，花卉等。我无法弄清楚用于训练分类器的功能。这些图像中有很多绿色植物，但有许多花卉图像，没有太多的绿色成分。另一个特征是叶子和花瓣的形状。

如果有人可以建议如何提取此形状特征并使用它来训练分类器，那将会很有帮助。还建议可以使用哪些其他功能来训练分类器并且在提取特征之后，将使用哪种算法来训练分类器？

2 个答案:

答案 0 :(得分：4)

不确定形状信息是您链接到的数据集的方法。

只需快速浏览一些图片，我就会有一些分类建议：

自然场景很少有直线 - 线检测
您可以打折其中包含“不自然”颜色的场景。
如果你想尝试更先进的东西，我会建议熵/模式识别之间的混合会形成一个好的分类器，因为自然场景有很多。
尝试模板匹配/形状匹配的叶子/花瓣会打破你的心脏 - 你需要使用更广泛的东西。

至于使用哪种分类器...我通常建议最初使用K-means，一旦你得到一些结果，就可以确定实施贝叶斯或神经网络的额外努力是否值得。

希望这有帮助。

吨。

<强>扩展

“不自然的颜色”可能是绿色和棕色之外的高度饱和的颜色。它们适用于探测自然场景，因为即使花朵位于其中心，绿色/棕色光谱中应该有约50％的场景。

此外，直线检测应该在自然场景中产生很少的结果，因为直边在本质上是罕见的。在基本级别生成边缘图像，阈值，然后搜索线段（近似直线的像素）。

熵需要一些机器视觉知识。您可以通过确定本地化的熵来逼近场景，然后对结果进行直方图编制here是一种类似的方法，您必须使用它。

如果您要尝试进行模式识别，您可能希望在Machine Vision上进步，因为这是一个困难的主题，而不是您可以在代码示例中抛出的东西。一旦颜色和边缘信息（线）耗尽，我只会尝试将它们作为分类器来实现。

如果这是商业应用程序，则应咨询MV专家。如果这是大学作业（除非是论文），颜色和边缘/线条信息应该绰绰有余。

答案 1 :(得分：0)

我认为，

HOOG功能几乎是这类问题的事实上的标准。他们有点参与计算（我不知道你在做什么环境）但功能强大。

一个更简单的解决方案，可能会让你启动并运行，取决于数据集的难度，是从图像中提取所有重叠的补丁，使用k-means（或任何你喜欢的）聚类它们，然后代表一个图像作为对诸如SVM的监督分类器的这组量化图像块的分布。你会惊讶地发现这样的事情经常发生，它至少应该提供一个有竞争力的基线。