答案 0 :(得分:2)
ε是近似参数。
LSH(作为FLANN& kd-GeRaF)专为高维数据而设计。在那个空间中,k-NN效果不好,实际上它几乎和蛮力一样慢,因为curse of dimensionality。
出于这个原因,我们专注于解决aproximate k-NN。检查我们的paper中的定义1,它基本上说可以返回一个近似邻居(1 +ε)远比确切邻居更远的距离。
检查下图:
在这里,您可以看到找到精确/近似NN的含义。在NNS(最近邻搜索)的传统问题中,我们被要求找到确切的NN。在现代问题中,近似NNS,我们被要求在(1 +ε)半径内找到一些邻居,因此精确或近似NN将是有效答案!
因此,LSH很有可能在半径(1 +ε)内返回NN。对于ε= 0,我们实际上解决了确切的NN问题。