局部敏感散列 - 当桶为空时会发生什么?

时间:2016-12-18 21:54:33

标签: locality-sensitive-hash

假设我已经根据一些哈希值构建了一个LSH数据库,我现在开始查询数据库以找到近似的最近邻居。

对于计算查询点的哈希值时,会出现什么指导,并且相应的存储桶为空?同样地,假设我想找到5个近似最近邻居,并且该桶只有4个其他数据点?

1 个答案:

答案 0 :(得分:1)

我认为检索得分太少意味着你的训练数据有太多的存储桶。当然,这取决于应用程序。看看LSH toolbox by Greg Shakhnarovich实施和他的README file。在这个实现中,更少的散列函数(更小的k)意味着更丰富的桶,这反过来意味着更慢的LSH。