从DBSCAN中选择带有R中空间数据(lon,lat)的eps和minPts?

时间:2019-03-10 20:05:15

标签: r spatial dbscan

我知道以前的帖子已经讨论了这个主题,但是我找不到任何专门针对空间点数据的信息。我有一个数据集,其中包含2013年在纽约发生的所有停靠点和滚动停靠点。我试图确定停靠点的“热点”。数据格式如下:

stops <- data.frame(lon=c(-74.00478, -74.01046, -74.00521),
                    lat=c(40.71641, 40.71153, 40.72063),
                    precinct = c(1,1,1))

还有其他功能(总计= 89),例如停止时间,可疑种族,停止原因等。还共有173,671个观测值。

我的问题是执行knn方法来找到eps,我是否必须转换经纬度,还是可以原样使用它们?

我的另一个问题是如何选择minPts?我看过其他有关Tableau集成的python和R犯罪数据的教程,似乎他们似乎是根据某些事件计数来选择它的。我使用此代码获得了与一天中发生的平均停车次数相关的minPts,但我不确定这是否可靠。

stops2013clean %>%
group_by(precinct, lubridate::hour(stops2013clean$time)) %>%
summarise(n_stops=n()) %>%
summarise(mean(n_stops)) %>%
summarise(mean(`mean(n_stops)`))

感谢您的帮助和指导。

0 个答案:

没有答案