我有一个很大的数据集,其中包含很多地理位置数据(长/纬度),我想根据频率进行映射。我只想显示城市和区域的频率,而不是每个确切位置的频率。由于每个城市的地理位置数据可能会有所不同,因此必须对数据进行汇总/聚类。
不幸的是,仅四舍五入不起作用。我已经尝试创建一个矩阵来测量每个点的距离,但是我的向量内存不足。有没有更简单的方法?
原始数据如下所示:
$long $lat
12.40495 52.52001
13.40233 52.50141
13.37698 52.51607
13.38886 52.51704
13.42927 52.48457
9.993682 53.55108
9.992470 53.55334
10.000654 53.55034
11.58198 48.13513
11.51450 48.13910
... ...
结果应如下所示:
$long $lat $count
13.40495 52.52001 5
9.993682 53.55108 3
11.58198 48.13513 2
... ... ...
编辑1: 要将点聚类为一个点,范围为25-50 km就可以了。