R NMI有不同的标签

时间:2018-03-26 10:05:58

标签: r cluster-analysis

我有20个带标签的元素。我想在不使用标签的情况下通过某些技术对这些元素进行聚类,例如Hierarchical clustering。 现在,对于我的每个元素,我都有原始标签,例如:

 c(rep("a",7),rep("b","8"),rep("c",5)) ## my labels

和通过分层聚类获得的标签

 c(1,1,1,1,2,3,2,2,2,2,2,2,1,3,3,1,2,3,3,3) ## labels through HC

现在,我如何使用不同标签的规范化互信息?

2 个答案:

答案 0 :(得分:1)

如果我理解正确,这应该不是问题。请记住,NMI将数据帧或矩阵作为输入。

如果您将变量名称设为1 ... 20,则应该可以使用:

NMI(cbind(seq(1:20), original.labels), cbind(seq(1:20), new.labels))

答案 1 :(得分:0)

NMI将一个标签与另一个每个标签进行比较。

因此,如果它们不同则无关紧要。

只关系它们如何交叉。