我的图片数据集来自http://www.image-net.org。对于不同的事物,如植物群,动物群,人等,有各种各样的同义词
我必须训练一个分类器,如果图像属于花卉同义词,则预测1,否则为0。
通过单击左侧窗格中的植物,植物,植物生命选项,可以在http://www.image-net.org/explore查看属于花卉synset的图像。
这些图像包括各种各样的植物 - 如树木,草本植物,灌木,花卉等。
我无法弄清楚用于训练分类器的功能。这些图像中有很多绿色植物,但有许多花卉图像,没有太多的绿色成分。另一个特征是叶子和花瓣的形状。
如果有人可以建议如何提取此形状特征并使用它来训练分类器,那将会很有帮助。还建议可以使用哪些其他功能来训练分类器 并且在提取特征之后,将使用哪种算法来训练分类器?
答案 0 :(得分:4)
不确定形状信息是您链接到的数据集的方法。
只需快速浏览一些图片,我就会有一些分类建议:
至于使用哪种分类器...我通常建议最初使用K-means,一旦你得到一些结果,就可以确定实施贝叶斯或神经网络的额外努力是否值得。
希望这有帮助。
吨。
<强>扩展强>
“不自然的颜色”可能是绿色和棕色之外的高度饱和的颜色。它们适用于探测自然场景,因为即使花朵位于其中心,绿色/棕色光谱中应该有约50%的场景。
此外,直线检测应该在自然场景中产生很少的结果,因为直边在本质上是罕见的。在基本级别生成边缘图像,阈值,然后搜索线段(近似直线的像素)。
熵需要一些机器视觉知识。您可以通过确定本地化的熵来逼近场景,然后对结果进行直方图编制here是一种类似的方法,您必须使用它。
如果您要尝试进行模式识别,您可能希望在Machine Vision上进步,因为这是一个困难的主题,而不是您可以在代码示例中抛出的东西。一旦颜色和边缘信息(线)耗尽,我只会尝试将它们作为分类器来实现。
如果这是商业应用程序,则应咨询MV专家。如果这是大学作业(除非是论文),颜色和边缘/线条信息应该绰绰有余。
答案 1 :(得分:0)
HOOG功能几乎是这类问题的事实上的标准。他们有点参与计算(我不知道你在做什么环境)但功能强大。
一个更简单的解决方案,可能会让你启动并运行,取决于数据集的难度,是从图像中提取所有重叠的补丁,使用k-means(或任何你喜欢的)聚类它们,然后代表一个图像作为对诸如SVM的监督分类器的这组量化图像块的分布。你会惊讶地发现这样的事情经常发生,它至少应该提供一个有竞争力的基线。