最近,我选择在公共数据集上使用DBSCAN群集。但参数Eps和minpts非常敏感,很难在整个数据集中获得具有良好性能的良好参数值。在调整DBSCAN的参数时似乎过度拟合。我知道EM算法可用于调整GMM模型的参数。我想知道是否可以将EM算法用于DBSCAN。我需要一些关于它的想法或建议。以前有人试过吗?
答案 0 :(得分:0)
我认为你没有意义地将它用于标记DBSCAN。此连通性模型中没有“概率”。连接是一个二元属性,如果你试图最大化它,它只会使一切连接,即。 epsilon = inifnity。