我应该使用什么例程或算法为DBSCAN算法提供eps和minPts参数以获得有效结果?
答案 0 :(得分:0)
DBSCAN论文建议根据维度选择minPts,并根据k距离图中的肘部选择eps。
在最近的出版物中
Schubert,E.,Sander,J.,Ester,M.,Kriegel,H.P。& Xu,X。(2017)。
DBSCAN再访,重访:为什么以及如何(仍)使用DBSCAN。
ACM数据库系统事务(TODS),42(3),19。
作者建议对大而嘈杂的数据集使用更大的minpts,并根据你是否获得太大的簇(减少epsilon)或过多的噪声(增加epsilon)来调整epsilon。聚类需要迭代。
该论文是一本有趣的读物,因为它显示了如果你不看你的数据会出现什么问题。人们对绩效指标过于痴迷,忘记查看实际数据。