如何使用EM算法确定DBSCAN在一个数据集上的参数(eps,minpts)?

时间:2017-11-15 10:50:15

标签: parameters em dbscan

最近,我选择在公共数据集上使用DBSCAN群集。但参数Eps和minpts非常敏感,很难在整个数据集中获得具有良好性能的良好参数值。在调整DBSCAN的参数时似乎过度拟合。我知道EM算法可用于调整GMM模型的参数。我想知道是否可以将EM算法用于DBSCAN。我需要一些关于它的想法或建议。以前有人试过吗?

1 个答案:

答案 0 :(得分:0)

高斯混合模型的EM算法效果很好,因为GMM是一个概率模型。它产生每个点的概率,并且您知道如何推断模型参数以最大化概率。

我认为你没有意义地将它用于标记DBSCAN。此连通性模型中没有“概率”。连接是一个二元属性,如果你试图最大化它,它只会使一切连接,即。 epsilon = inifnity。