我知道这可能是一个相当noob的问题,但你们是否知道我应该如何实现多探头LSH?我非常感谢任何答复或回应。
- 更新 -
尝试使用提供的工具fitdata为我的数据创建一个模型,但它似乎没有收录我的文件。我用于输入的格式是这种格式,float size:4,数据的数量:20,dimension:297,以及我的297 dimenison float数组的数组。但是它给了我这个错误
gsl: init_source.c:29: ERROR: matrix dimension n1 must be positive integer
Default GSL error handler invoked.
Aborted
你们有没有想过如何为fitdata创建输入?
- 更新 -
对不起,在尝试lsh后更新。您可以使用text2bin格式化fitdata的数据。文本文件包含图像或音频文件的特征向量,每行代表一个向量。之后,使用mplsh-tune获取M和W参数。 要构造索引,可以使用扫描工具对一组所需的查询进行采样,并且可以使用mplsh-run来获取索引。 现在我试图弄清楚如何使用索引以及如何将库链接到我的编码。有没有人对此有任何想法?
答案 0 :(得分:6)
让我转而指向spectral hashing,这会让LSH but but大屁股。奖励:他们有matlab代码on their website,您可以使用或验证自己的实现。此外,它更容易实现。
答案 1 :(得分:0)
This implementation比C ++库更容易使用。它还实现了LSH Forest。