我使用Bag视觉词进行分类。 我已经为每个图像量化了SIFT描述符100个单词,并对图像的直方图进行了编码并完成了分类。
现在,我想尝试组合两个不同的描述符和检测器,即SIFT和SURF,这意味着关键点的数量不会相同,也不是描述符维度(SIFT 128D和SURF 64D)。
将它们组合起来最简单的方法是什么?
如果,对于每个图像,我为SIFT编码一个直方图(将是100x1直方图)而另一个用于SURF(另一个100x1),然后将它们堆叠在一起制作200x1直方图,这是正确的吗?
还有其他方式吗?
提前多多感谢。
答案 0 :(得分:0)
在单词中,关键点的数量或描述符大小无关紧要,一旦生成代码簿,就会得到一个直方图,其尺寸取决于您的代码簿大小。同样,直方图被标准化,因此它不依赖于每个图像检测到的特征的数量。假设你有SIFT和SURF功能,你需要做的就是生成2个码本并将它们连接起来以获得一个特征向量。
这里提到了该方法的简要概述: http://en.wikipedia.org/wiki/Bag-of-words_model_in_computer_vision