如何为有效结果选择eps和minPts(DBSCAN算法的两个参数)?

时间:2017-11-28 14:25:45

标签: python cluster-analysis dbscan

我应该使用什么例程或算法为DBSCAN算法提供eps和minPts参数以获得有效结果?

1 个答案:

答案 0 :(得分:0)

DBSCAN论文建议根据维度选择minPts,并根据k距离图中的肘部选择eps。

在最近的出版物中

  

Schubert,E.,Sander,J.,Ester,M.,Kriegel,H.P。& Xu,X。(2017)。
DBSCAN再访,重访:为什么以及如何(仍)使用DBSCAN。
ACM数据库系统事务(TODS),42(3),19。

作者建议对大而嘈杂的数据集使用更大的minpts,并根据你是否获得太大的簇(减少epsilon)或过多的噪声(增加epsilon)来调整epsilon。聚类需要迭代。

该论文是一本有趣的读物,因为它显示了如果你不看你的数据会出现什么问题。人们对绩效指标过于痴迷,忘记查看实际数据。