在快速查询大型数据库中的类似图像或文本时,我正在阅读很多关于词汇树的内容。但是我找不到关于这样一个词汇树是什么以及如何建立一个特征的任何好的(易于理解的)描述。
答案 0 :(得分:2)
词汇树是一种进行图像检索的紧凑方式。实现该算法基本上有三个步骤,并且它高度依赖于其他计算机视觉技术,例如SIFT功能。
第一步是使用sift描述符构建一个kmeans树。这棵树的叶节点包含一个" bag"筛选描述符第二步是使用您在第一步中构建的词汇表树构建图像数据库。您可以将此过程视为将图像量化为矢量空间。然后第三步是针对图像数据库查询图像。当然还有一些详细的技术,如倒排列表等。
这是一个很好的词汇树实现 - libvot。它基本上遵循我上面描述的三个步骤。它使用C ++ 11标准的多线程库来加速构建过程,因此运行速度非常快。
以下是有关它的原始研究paper。这些年来它对计算机视觉社区的影响很大。
答案 1 :(得分:1)