使用群集分配矩阵将群集标签分配给数据

时间:2016-02-25 05:52:24

标签: r machine-learning cluster-analysis

您好我正在使用R并且拥有一个来自我的群集功能的群集分配矩阵。 (我在高斯混合数据上应用聚类算法)我想创建一个聚类数据矩阵。这是我想做的玩具示例。

#simulate data

dat=Z<-c(rnorm(2,0,1),rnorm(2,2,3),rnorm(3,0,1),rnorm(3,2,3))
 dat
 [1] -0.5350681  1.0444655  2.9229136  8.2528266 -0.7561170 -1.0240702     -1.0012780
 [8] -0.1322981  7.8525855  2.2278264

# Making up a cluster assignment matrix (actually this one comes out of my      
#clustering function

amat<-matrix(c(1,1,0,0,1,1,1,0,0,0,0,0,1,1,0,0,0,1,1,1), ncol=2, nrow=10)
        amat
       [,1] [,2]
 [1,]    1    0
 [2,]    1    0
 [3,]    0    1
 [4,]    0    1
 [5,]    1    0
 [6,]    1    0
 [7,]    1    0
 [8,]    0    1
 [9,]    0    1
[10,]    0    1

我想使用上面给出的赋值矩阵创建包含集群标签的数据帧或向量,包括如下所示的“clust”。基本上,它使用赋值矩阵的第一列和第二列,并将标签1分配给来自正常的数据分布N(0,1)并将标签2分配给来自正态分布N(2,3)的数据。非常感谢。提前谢谢。

    # clust should look like this (I have no idea how to create this using amat and dat)

    clust
 [1] 1 1 2 2 1 1 1 2 2 2

2 个答案:

答案 0 :(得分:1)

矢量已经是二进制的。我们可以将1L添加到第二列:

clust <- amat[,2] + 1L
[1] 1 1 2 2 1 1 1 2 2 2

(后缀L强制价值为integer

答案 1 :(得分:1)

这本质上不是

1 * column1 + 2 * column2 +3 * column3等等?

应该直接写为矩阵乘法[1,2,3,4,...]和求和操作。