Locality Sensitive Hashing(LSH)中的ε(epsilon)参数是什么?

时间:2016-05-21 03:08:07

标签: computational-geometry nearest-neighbor approximation locality-sensitive-hash approximate-nn-searching

我已阅读original paper关于Locality Sensitive Hashing的内容。

复杂性取决于参数ε,但我不明白它是什么。

你能解释一下它的含义吗?

1 个答案:

答案 0 :(得分:2)

ε是近似参数

LSH(作为FLANN& kd-GeRaF)专为高维数据而设计。在那个空间中,k-NN效果不好,实际上它几乎和蛮力一样慢,因为curse of dimensionality

出于这个原因,我们专注于解决aproximate k-NN。检查我们的paper中的定义1,它基本上说可以返回一个近似邻居(1 +ε)远比确切邻居更远的距离。

检查下图:

enter image description here

在这里,您可以看到找到精确/近似NN的含义。在NNS(最近邻搜索)的传统问题中,我们被要求找到确切的NN。在现代问题中,近似NNS,我们被要求在(1 +ε)半径内找到一些邻居,因此精确或近似NN将是有效答案!

因此,LSH很有可能在半径(1 +ε)内返回NN。对于ε= 0,我们实际上解决了确切的NN问题。