我有20个带标签的元素。我想在不使用标签的情况下通过某些技术对这些元素进行聚类,例如Hierarchical clustering。 现在,对于我的每个元素,我都有原始标签,例如:
c(rep("a",7),rep("b","8"),rep("c",5)) ## my labels
和通过分层聚类获得的标签
c(1,1,1,1,2,3,2,2,2,2,2,2,1,3,3,1,2,3,3,3) ## labels through HC
现在,我如何使用不同标签的规范化互信息?
答案 0 :(得分:1)
如果我理解正确,这应该不是问题。请记住,NMI将数据帧或矩阵作为输入。
如果您将变量名称设为1 ... 20,则应该可以使用:
NMI(cbind(seq(1:20), original.labels), cbind(seq(1:20), new.labels))
答案 1 :(得分:0)
NMI将一个标签与另一个每个标签进行比较。
因此,如果它们不同则无关紧要。
只关系它们如何交叉。