基于地理坐标查找最大距离内的聚类

时间:2019-01-28 12:44:15

标签: python geolocation cluster-analysis latitude-longitude distance-matrix

我有包含长期数据的数据集。

('ID','Latitude','Longitude')

('A0001',19.222,71.555)

使用此数据,我计算了距离矩阵,其中M [i] [j]是ID:i和ID:j之间的距离。

使用以下代码计算距离:

geopy.distance.vincenty((a,b),(c,d)).miles

有没有找到半径X英里内的星团的最佳方法。

当前的大多数聚类(例如“ DBSCAN” K-Means)都提供了最小距离和最小样本的选项,但是我正在寻找能够提供最大距离的聚类方法。

第二,如果不需要的话,我可以不计算距离矩阵。

1 个答案:

答案 0 :(得分:0)

进行完整的链接层次聚类。

如果以距离x切割树,则同一簇中的任何两个点的距离最多为x。它不是最佳的(因为它将是NP完整的),但通常足够好。