我有包含长期数据的数据集。
('ID','Latitude','Longitude')
('A0001',19.222,71.555)
使用此数据,我计算了距离矩阵,其中M [i] [j]是ID:i和ID:j之间的距离。
使用以下代码计算距离:
geopy.distance.vincenty((a,b),(c,d)).miles
有没有找到半径X英里内的星团的最佳方法。
当前的大多数聚类(例如“ DBSCAN” K-Means)都提供了最小距离和最小样本的选项,但是我正在寻找能够提供最大距离的聚类方法。
第二,如果不需要的话,我可以不计算距离矩阵。
答案 0 :(得分:0)
进行完整的链接层次聚类。
如果以距离x切割树,则同一簇中的任何两个点的距离最多为x。它不是最佳的(因为它将是NP完整的),但通常足够好。