Question

我有包含长期数据的数据集。

('ID','Latitude','Longitude')

('A0001',19.222,71.555)

使用此数据，我计算了距离矩阵，其中M [i] [j]是ID：i和ID：j之间的距离。

使用以下代码计算距离：

geopy.distance.vincenty((a,b),(c,d)).miles

有没有找到半径X英里内的星团的最佳方法。

当前的大多数聚类（例如“ DBSCAN” K-Means）都提供了最小距离和最小样本的选项，但是我正在寻找能够提供最大距离的聚类方法。

第二，如果不需要的话，我可以不计算距离矩阵。

Answer 1

进行完整的链接层次聚类。

如果以距离x切割树，则同一簇中的任何两个点的距离最多为x。它不是最佳的（因为它将是NP完整的），但通常足够好。