开源对象识别算法

时间:2011-10-10 23:27:22

标签: image-recognition object-recognition

我一直在使用正确的算法进行大量搜索,以用于我的对象识别程序。但我发现的一切都有一些重大缺陷。

我的程序应该在遇到它们时在线学习新对象。当遇到一个新对象时,就会在它上面绑定一个框并学习该对象(OpenTLD完美地完成了这一操作)。对于不同的对象重申这1000次,程序应该能够识别1000个类和对象的实例(Haar类特征级联可以做到这一点,OpenTLD失败)。算法必须是比例和方向不变(哈尔失败)。

我发现的所有内容都只能满足上述某些标准,而其他标准则失败。令人惊讶的是,我还遇到了任何符合所有标准的东西。我只提到了上面的Haar和OpenTLD,因为它们是最接近我需要的。其他算法,如SIFT,SURF甚至比我需要的更远。

所以我的问题是,是否有任何现有的源代码可以满足我的需求?或者这是我用更好的运气来修改现有的源代码吗?

1 个答案:

答案 0 :(得分:4)

TLD和Kalal的工作非常适合跟踪。但是,识别是一个非常不同的问题。

我不明白为什么你要求SIFT或SURF进行识别。我肯定会朝这个方向看。定向梯度直方图(HoG)(Wikipedia)是一系列相关的算法,被认为是最先进的。例如,它在许多ICIP'11论文中以某种形式使用。

你所问的仍然是计算机视觉中尚未解决的问题。您将找不到很多现成的代码。研究代码(例如Matlab),用于非商业用途,是的,但您可能需要对实际使用进行大量修改/优化。像Pongr,Kooaba,IQEngines这样的公司提供用于对象识别的在线API。