应用错误收集

时间：2018-06-29 11:38:37

标签： r algorithm cluster-analysis geospatial dbscan

我想使用基于密度的算法对地理数据（至少是坐标，高度）进行聚类。我发现DBSCAN应该可以很好地达到我的目的。我甚至希望有带有点1或2的较小的单独群集。它可以完成工作，但是将其他点保留为一个巨大的群集或噪点，并且我也希望将这些群集到较小的组中。

例如，如果我有两组高点（如山脉）位于地图上的不同位置，则希望它们位于两个单独的群集中。如何实现呢？也许以某种方式在算法中设置最高分值？我感谢任何建议。

P.S。我为此目的使用了R，但问题更多是关于方法。

答案 0 :(得分：1)

不要使用太小的分钟数。

1或2分不是“集群”。这些要点是“噪音”。只需将噪声中的所有点视为单独的群集，或者如果您确实愿意，可以将它们连接在足够短的距离内。您可以轻松地对噪声进行后处理。

但是出于 density 基础聚类的目的，您需要更多点才能具有 density 。实际上，对于最多2分钟的分钟，DBSCAN会退化为单链接集群。