Several questions已被问及SIFT algorithm,但他们似乎都专注于两张图片之间的简单比较。不是确定两个图像的相似程度,而是使用SIFT从数千个图像的集合中找到最接近的匹配图像是否切合实际?换句话说,SIFT是否具有可扩展性?
例如,使用SIFT为一批图像生成关键点,将关键点存储在数据库中,然后找到与为“查询”图像生成的关键点具有最短欧氏距离的那些图像是否可行?
在计算欧几里德距离时,你会忽略关键点的x,y,比例和方向部分,只看一下描述符吗?
答案 0 :(得分:8)
有几种方法。
一种流行的方法是所谓的词袋表示,它仅根据多少描述符匹配进行匹配,从而忽略由(x,y,缩放和方向)组成的位置部分,并只查看描述符。 / p>
高效查询大型数据库可能会使用近似方法,如locality sensitive hashing
其他方法可能涉及vocabulary trees或其他数据结构。
有关同时考虑位置信息的有效方法,请查看pyramid match kernels