我正在寻找一种可以在大型集合中搜索类似图像的算法。 我目前在OpenCL中使用SURF implementation。
首先,我使用KNN搜索算法将每个图像的插入点与其余部分进行比较,但测试表明它不能很好地扩展。我还尝试了KNN-Join的Hadoop实现,它在HDFS中占用了很多临时空间,与输入数据量相比太多了。实际上,由于输入向量的维数(64),成对距离方法并不合适。
我听说过Locally Sensitive Hashing,并且想知道是否有任何免费实施,或者是否值得实施,也许还有另外一种我不知道的算法?