标签: graph cluster-analysis nearest-neighbor dlib euclidean-distance
我在128维空间中拥有数十亿个点。点的每个坐标都在(-1; 1)范围内。该算法获取一个点作为输入,并返回所有点,到目标点的欧氏距离小于0.5。但是我希望该算法能够快速运行而无需计算到每个点的距离。
因此,我需要创建点彼此相邻的聚类,并且必须在离目标点最近的聚类内进行搜索。
我尝试使用 k-means ++ , GMM , kd-tree 进行聚类,但是搜索准确性低于80%。 在这种情况下,您会推荐什么?
P.S。近似最近邻算法不会显着提高速度。