标签: python cluster-analysis evaluation
我正在研究重叠子空间聚类中的聚类评估措施。但是,我仍然找不到真正可以帮助我衡量集群质量的东西。到目前为止,我认为最适合我的方法是使用Jaccard索引。下图显示了重叠子空间聚类的示例。
集群的预期结果。
如您所见,我可以看到行和列重叠。因此,如果我使用传统的度量标准(例如ARI,Silhouette,DB),则不会考虑重叠部分来获取质量。有人在这方面研究过什么吗?抱歉,如果我错过任何演示规则,这是我第一次在这里进行互动。