您好我正在使用R并且拥有一个来自我的群集功能的群集分配矩阵。 (我在高斯混合数据上应用聚类算法)我想创建一个聚类数据矩阵。这是我想做的玩具示例。
#simulate data
dat=Z<-c(rnorm(2,0,1),rnorm(2,2,3),rnorm(3,0,1),rnorm(3,2,3))
dat
[1] -0.5350681 1.0444655 2.9229136 8.2528266 -0.7561170 -1.0240702 -1.0012780
[8] -0.1322981 7.8525855 2.2278264
# Making up a cluster assignment matrix (actually this one comes out of my
#clustering function
amat<-matrix(c(1,1,0,0,1,1,1,0,0,0,0,0,1,1,0,0,0,1,1,1), ncol=2, nrow=10)
amat
[,1] [,2]
[1,] 1 0
[2,] 1 0
[3,] 0 1
[4,] 0 1
[5,] 1 0
[6,] 1 0
[7,] 1 0
[8,] 0 1
[9,] 0 1
[10,] 0 1
我想使用上面给出的赋值矩阵创建包含集群标签的数据帧或向量,包括如下所示的“clust”。基本上,它使用赋值矩阵的第一列和第二列,并将标签1分配给来自正常的数据分布N(0,1)并将标签2分配给来自正态分布N(2,3)的数据。非常感谢。提前谢谢。
# clust should look like this (I have no idea how to create this using amat and dat)
clust
[1] 1 1 2 2 1 1 1 2 2 2
答案 0 :(得分:1)
矢量已经是二进制的。我们可以将1L
添加到第二列:
clust <- amat[,2] + 1L
[1] 1 1 2 2 1 1 1 2 2 2
(后缀L
强制价值为integer
)
答案 1 :(得分:1)
这本质上不是
1 * column1 + 2 * column2 +3 * column3等等?
应该直接写为矩阵乘法[1,2,3,4,...]和求和操作。