我知道以前的帖子已经讨论了这个主题,但是我找不到任何专门针对空间点数据的信息。我有一个数据集,其中包含2013年在纽约发生的所有停靠点和滚动停靠点。我试图确定停靠点的“热点”。数据格式如下:
stops <- data.frame(lon=c(-74.00478, -74.01046, -74.00521),
lat=c(40.71641, 40.71153, 40.72063),
precinct = c(1,1,1))
还有其他功能(总计= 89),例如停止时间,可疑种族,停止原因等。还共有173,671个观测值。
我的问题是执行knn方法来找到eps,我是否必须转换经纬度,还是可以原样使用它们?
我的另一个问题是如何选择minPts?我看过其他有关Tableau集成的python和R犯罪数据的教程,似乎他们似乎是根据某些事件计数来选择它的。我使用此代码获得了与一天中发生的平均停车次数相关的minPts,但我不确定这是否可靠。
stops2013clean %>%
group_by(precinct, lubridate::hour(stops2013clean$time)) %>%
summarise(n_stops=n()) %>%
summarise(mean(n_stops)) %>%
summarise(mean(`mean(n_stops)`))
感谢您的帮助和指导。