我有一组简单的刚性3D对象,我希望从图像中检测和识别(比如5到10个类)。这些物体在某种意义上是简单的,它们是一种颜色的圆柱体或具有简单图案(例如条纹)的矩形或一些类似的简单形状。物体彼此显着不同(例如,不存在两个类,其中一个是大圆柱体而另一个是相同但较小的圆柱体)。 因为纹理非常简单(实体和/或简单模式),所以单词方法失败(它们不包含大量独特边缘)。
虽然一种可能的方法是手动编码每个分类器(手动特征提取等),但是有一种简单的数据驱动方法(例如Haar / LBP分类器)可以工作吗?如果Haar或LBP有利于解决这个问题,那么如何解决未知相对视点的问题(以及通过这种透视失真,旋转等)?只是从一个对象的所有可能的观点提供正面图像会聚或是否还有其他通常做的事情?检测和识别应该是实时运行的。
答案 0 :(得分:1)
根据您对问题的描述,我看到了基于Haar或LBP的探测器的几个缺点。首先,这些功能不使用颜色,这在这里似乎很重要。其次,使用Haar或LBP特征的分类器对平面内和平面外旋转敏感。如果您的对象可以处于任何3D方向,则需要对3D旋转范围进行离散化,并为每个旋转训练单独的探测器。例如,对于面部检测,您通常使用两个检测器:一个用于正面,一个用于轮廓面。最后,如果单词袋没有足够的纹理,那么Haar或LBP的纹理可能也不够。
由于您的对象是简单的3D形状,我首先尝试使用Hough变换检测直线和圆,然后尝试将它们分组以形成对象的轮廓。