关于多探针局部敏感哈希的问题

时间:2010-04-04 15:28:34

标签: c++ algorithm image-processing machine-learning hash

很抱歉要问这种noob问题,但因为我真的需要一些关于如何使用Multi probe LSH的指导非常紧急,所以我自己没有做太多的研究。我意识到有一个可以实现该算法的lib调用LSHKIT,但我无法弄清楚如何使用它。 现在,我有几千个特征向量296维度,每个维度代表一个图像。该向量用于查询用户输入图像,以检索最相似的图像。我用来推导矢量之间距离的方法是欧几里德距离。

我知道这可能是一个相当noob的问题,但你们是否知道我应该如何实现多探头LSH?我非常感谢任何答复或回应。

- 更新 -

尝试使用提供的工具fitdata为我的数据创建一个模型,但它似乎没有收录我的文件。我用于输入的格式是这种格式,float size:4,数据的数量:20,dimension:297,以及我的297 dimenison float数组的数组。但是它给了我这个错误

gsl: init_source.c:29: ERROR: matrix dimension n1 must be positive integer
Default GSL error handler invoked.
Aborted

你们有没有想过如何为fitdata创建输入?

- 更新 -

对不起,在尝试lsh后更新。您可以使用text2bin格式化fitdata的数据。文本文件包含图像或音频文件的特征向量,每行代表一个向量。之后,使用mplsh-tune获取M和W参数。 要构造索引,可以使用扫描工具对一组所需的查询进行采样,并且可以使用mplsh-run来获取索引。 现在我试图弄清楚如何使用索引以及如何将库链接到我的编码。有没有人对此有任何想法?

2 个答案:

答案 0 :(得分:6)

让我转而指向spectral hashing,这会让LSH but but大屁股。奖励:他们有matlab代码on their website,您可以使用或验证自己的实现。此外,它更容易实现。

答案 1 :(得分:0)

多探针LSH的

This implementation比C ++库更容易使用。它还实现了LSH Forest。