我对寻找空间数据集(lon,lat)中最近邻居簇距离的分布感兴趣。我的聚类标准很简单,这意味着当两个点彼此相邻时,它们属于同一聚类,并且聚类中的最小点数为1。为此,我正在使用sklearn.cluster.DBSCAN。聚类后,我想找到每个聚类到最近的聚类的距离,这就是我遇到的问题。我发现的所有内容都会计算出群集的质心之间的最近邻居距离,而我想使用边界。
目前,我这样做是从一个聚类中获取所有点,然后计算该聚类中每个点与其余聚类中所有点之间的距离,最后求出最小距离。但是,您可以想象这是非常低效的,并且计算要花很多时间。
有人知道该怎么做吗?
答案 0 :(得分:0)
使用Nearesr-Neighbor分类器。
但在所有点中,不是聚类中心!
Sklearn具有实用程序功能,可以使查找最近的邻居比计算所有距离(例如使用kd树)更快。