地理位置聚类

时间:2016-03-03 03:17:42

标签: geolocation location cluster-analysis k-means dbscan

我有一个客户位置流数据,如果位置是他通常访问的位置,我需要分析和检查每个事件,如果不是他通常访问的位置,则实时生成警报。 我正在研究各种聚类算法,但找不到一个能够实时实现的算法。

Kmeans过于僵化,中心数量太多.DBSCAN重量很重,不确定它是否足够快以及实时响应......

你能建议一个适合实时流处理的吗?

1 个答案:

答案 0 :(得分:0)

我相信DBSCAN足够合适。其最坏情况的场景复杂度是O(n2),与其他传统算法(如分层算法)相比足够好。与kmeans相比,我相信如果您使用空间数据库(如SpatiaLIte或PostGIS)中的ST_Centroid函数(理所当然地认为您使用地理数据),则kmeans适用。 在kmeans和DBSCAN之间,我选择了DBSCAN,因为我认为你的问题的答案是关于实时数据的基于密度的方法。