标签: cluster-analysis hierarchical-clustering precision-recall
背景:我们是两名学生,他们打算使用分层凝聚聚类算法撰写关于逆向工程命名空间的论文。我们有一些链接方法和其他调整到我们想要尝试的算法。我们将在流行的GitHub存储库上运行该算法,并将创建的集群与最初存在的名称空间进行比较。我们的工作将密切关注this论文的工作。在论文中,作者提到使用“精确度回忆度量”来测量聚类算法的准确性。然而,更密切地关注度量及其来源,它似乎专注于扁平(非分层)集群。
问题: 有没有办法使用精确度调用度量来衡量恢复的集群层次结构的准确性?如果没有,还有哪些其他选择?