可以将局部敏感哈希应用于动态维数据点吗?

时间:2018-11-28 15:46:16

标签: hash similarity nearest-neighbor locality-sensitive-hash lsh

例如,假设我们有一些长度不同的向量,而我们要测量的是每两对向量之间的相似度。我们必须考虑的是这些向量的维是随时间变化的。我们可以做到吗?

1 个答案:

答案 0 :(得分:0)

在对该主题进行了一些研究之后,我发现了一些笔记可以与您分享。 LSH的缺点如下。

  • 由于LSH需要使用大量哈希表,因此会消耗大量内存。
  • 它不能简单地适应数据的插入和删除。
  • 此外,并非所有相似度指标都具有合适的哈希函数。
  • 然后,LSH在很大程度上取决于向量的长度。在某些情况下,两个向量可能有点相似,但LSH无法找到任何共同的Minhash,因此这些向量不被视为相似。

希望能对您有所帮助。