对于KNN而言,局部敏感哈希似乎是一种很好的技术,没有任何缺点。但是,如果有人在工业中将其用于实际应用,那么局部敏感散列的缺点是什么?在什么情况下LSH会失败或做得有点糟糕?或者编码/调整需要很长时间吗?
答案 0 :(得分:0)
这是一个相当广泛的问题,但由于你是新来的,我会尝试回答。
LSH并不像你描述的那样完美,当然,请搜索有关它的论文。也许这个问题可以提供帮助:How to understand Locality Sensitive Hashing?
有许多LSH库提供自动参数配置,但不是最重要的一个, R ,用于解决随机化 R-near邻居的版本。这是一个主要的缺点, ,因为用户必须这样做 在每个输入 手动识别R.在我看来,这是一个非常重要的方面,在实际应用方面,你必须考虑到这一点。
关于性能,一切都取决于您的输入!例如,在我的kd-GeRaF项目中,我彻底测试了LSH,我发现它在准确性和搜索速度方面可能有一些重要问题。数据集的范围,在高维空间中,执行ANNS。