我正在编写一个函数,用一组数千个图像创建一个BOW词汇表,然后我打算用这个词汇表为每个图像创建一个直方图。
我的问题是......当我的图像集发生变化时会发生什么?比方说我......
(a)以一组5000张图片开始,
(b)从这个集合创建BOW词汇表,然后
(c)浏览该集合并根据该词汇表为每个图像分配直方图(因此我最终得到5000个直方图)。
然后......稍后......我又添加了1000张图片,并希望为1000张新图像创建直方图。
我是否需要为整个6000张图像重新创建词汇表,然后重新创建6000张图像的直方图?
或者我可以使用我为原始5000获得的词汇来为新1000创建直方图吗?
这对匹配准确度有何影响?
答案 0 :(得分:0)
经过多次痛苦,研究和实验,我找到了答案。最好对整个图像集使用词汇表,但是可以创建一个固定的词汇表,然后使用这个词汇表创建直方图。
知道是否有可以使用的“参考词汇表”会很有用。即一组从分布均匀的图像中获取的词汇表,可用作一般分类器。