我有4维数据,需要进行聚类以构建每个聚类的最小体积边界椭球。我不想要单点聚类或至少,因为我们不能建立一个单点聚类的椭圆形置信区域。在我的问题中,预先没有给出簇数。所以我使用Scikit-learn的亲和力传播 - http://scikit-learn.org/stable/modules/clustering.html#affinity-propagation来估计群集的数量并根据数据执行群集。但这种方法给了我很多单点集群。你能透露一下如何解决这个问题吗?
P.S:为了给你更多的信息,我正在进行椭球嵌套抽样,以进行贝叶斯证据计算。
答案 0 :(得分:1)
我不知道您是否坚持亲和传播,但使用DBSCAN,您可以通过算法参数,eps和minPts实现您想要的效果。
更大的eps意味着可以检测到密度更小的聚类,并且也会合并近聚类。
更大的minPts意味着您将更多数据标记为噪音。