在R中按列匹配ID追加列

时间:2015-09-24 17:36:12

标签: r matrix merge dataframe append

所以我想要做的事情很难说清楚但非常简单,我可以很容易地告诉你。标题是我对verbage的最佳猜测,编辑指定。

set.seed(1)
theta=matrix(rnorm(6,0,1),2,3)
M =  c(    0 ,    0   ,   0  ,      0,   1  ,
 1,      0   ,   0    ,  0 ,    1,    
          2 ,     0   ,   0   ,   0, 2,
          0  ,    1   ,   0   ,   0 ,2,
          1   ,   1    ,  0   ,   0, 3,
          0    ,  2   ,   0 ,     0, 3)

M = matrix(M, nrow = 6,ncol= 5,byrow=T)
        theta
              [,1]     [,2]     [,3]
[1,] 0.4418121 1.962053 2.236691
[2,] 1.0931398 1.273616 1.050373

M
  prod11 prod12 prod21 prod22 d
1      0      0      0      0 1
2      1      0      0      0 1
3      2      0      0      0 2
4      0      1      0      0 2
5      1      1      0      0 3
7      0      2      0      0 3


OUTPUT DESIRED

  prod11 prod12 prod21 prod22 d theta1    theta2
1      0      0      0      0 1 0.4418121 1.0931398
2      1      0      0      0 1 0.4418121 1.0931398
3      2      0      0      0 2 1.962053  1.273616
4      0      1      0      0 2 1.962053  1.273616
5      1      1      0      0 3 2.236691  1.050373
7      0      2      0      0 3 2.236691  1.050373

3 个答案:

答案 0 :(得分:5)

我会使用data.table

setDT(M)
M[, paste0("theta",1:2) := as.data.table(t(theta[, d]))]
> M
   V1 V2 V3 V4 V5     theta1     theta2
1:  0  0  0  0  1 -1.2341141  0.4675928
2:  1  0  0  0  1 -1.2341141  0.4675928
3:  2  0  0  0  2 -0.6186437  1.5602801
4:  0  1  0  0  2 -0.6186437  1.5602801
5:  1  1  0  0  3  0.1233480 -0.3746259
6:  0  2  0  0  3  0.1233480 -0.3746259

我们需要as.data.tableas.data.frame,因为as.list会破坏矩阵结果的维度,而:=只会unlist t(theta[, d]) }

如果M确实存储为矩阵(由于您没有命名其尺寸,因此不清楚),我建议您使用{data.table(或data.frame)将其存储为M <- data.table(M) {1}}。

为了完整起见,这里有一个纯粹用矩阵表示法的解决方案:

M <- cbind(M, t(theta[, M[, "d"]]))

答案 1 :(得分:4)

使用base R

mat1 <- cbind(M, apply(theta, 1, function(x) x[M[, "d"]]))
colnames(mat1) <- c(colnames(M), paste0("theta", 1:nrow(theta)))
#      prod11 prod12 prod21 prod22 d       theta1     theta2
# [1,]      0      0      0      0 1 -0.893800723 -0.3073283
# [2,]      1      0      0      0 1 -0.893800723 -0.3073283
# [3,]      2      0      0      0 2 -0.004822422  0.9881641
# [4,]      0      1      0      0 2 -0.004822422  0.9881641
# [5,]      1      1      0      0 3  0.839750360  0.7053418
# [6,]      0      2      0      0 3  0.839750360  0.7053418

该功能的核心是x[M[, "d"]]。正如在Micheal的回答中,我们可以通过另一个向量将一个矩阵子集。向量是M的列“d”,M[, "d"]。如果该列具有更随机的代码,我们将设置更强大的查找。但由于它匹配theta的列号,我们可以直接使用它。

我用apply包装它,因为它适用于矩阵。第二个参数1表示该函数应该按行执行(相当于theta[1, ]theta[2, ],依此类推。如果我选​​择2,则x将等效到theta[ ,1]等等。

为了使列名与所需的输出相匹配,我们使用colnames(可能的陷阱是尝试使用names()来处理数据帧)。

答案 2 :(得分:1)

我们可以使用 V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 1 0 0 0 1 1 1 1 1 1 1 2 0 0 0 1 1 1 1 1 1 1 3 0 0 0 1 1 1 1 1 1 1 4 1 1 1 0 0 0 1 1 1 1 5 1 1 1 0 0 0 1 1 1 1 6 1 1 1 0 0 0 1 1 1 1 7 1 1 1 1 1 1 0 0 0 0 8 1 1 1 1 1 1 0 0 0 0 9 1 1 1 1 1 1 0 0 0 0 10 1 1 1 1 1 1 0 0 0 0

merge()

数据

theta <- t(theta) #transpose matrix 
theta <- cbind(theta,seq(1:nrow(theta))) # add column "d" with row numbers                
colnames(theta) <- c("theta1","theta2","d") 
merge(M,theta)
#  d prod11 prod12 prod21 prod22    theta1   theta2
#1 1      0      0      0      0 0.4418121 1.093140
#2 1      1      0      0      0 0.4418121 1.093140
#3 2      2      0      0      0 1.9620530 1.273616
#4 2      0      1      0      0 1.9620530 1.273616
#5 3      1      1      0      0 2.2366910 1.050370
#6 3      0      2      0      0 2.2366910 1.050370