我想使用基于密度的算法对地理数据(至少是坐标,高度)进行聚类。我发现DBSCAN应该可以很好地达到我的目的。我甚至希望有带有点1或2的较小的单独群集。它可以完成工作,但是将其他点保留为一个巨大的群集或噪点,并且我也希望将这些群集到较小的组中。
例如,如果我有两组高点(如山脉)位于地图上的不同位置,则希望它们位于两个单独的群集中。如何实现呢?也许以某种方式在算法中设置最高分值?我感谢任何建议。
P.S。我为此目的使用了R,但问题更多是关于方法。
答案 0 :(得分:1)
不要使用太小的分钟数。
1或2分不是“集群”。这些要点是“噪音”。只需将噪声中的所有点视为单独的群集,或者如果您确实愿意,可以将它们连接在足够短的距离内。您可以轻松地对噪声进行后处理。
但是出于 density 基础聚类的目的,您需要更多点才能具有 density 。实际上,对于最多2分钟的分钟,DBSCAN会退化为单链接集群。