将一个data.frame中的列值乘以R中条件的另一个data.frame中的列

时间:2012-03-09 18:21:37

标签: r dataframe

我在r中有两个数据框,我试图根据每列中的值进行组合。

df1=data.frame(comp=c("comp1", "comp2", "comp3","comp1"),
 state1=c(1,0,0,1),
 state2=c(1,1,0,1),
 state3=c(0,1,1,0),
 state4=c(0,0,1,0),year=c(1,1,1,2))

   comp state1 state2 state3 state4 year
1 comp1      1      1      0      0    1
2 comp2      0      1      1      0    1
3 comp3      0      0      1      1    1
4 comp1      1      1      0      0    2

df2=data.frame(state=c("state1","state2", "state3", "state4", 
                       "state1","state2", "state3", "state4"), 
 var1=c(1,0,0,1,0,0,1,1), 
 var2=c(0,1,0,0,0,1,1,0), 
 year=c(1,1,1,1,2,2,2,2))

DF2

    state var1 var2 year
1 state1    1    0    1
2 state2    0    1    1
3 state3    0    0    1
4 state4    1    0    1
5 state1    0    1    2
6 state2    0    1    2
7 state3    1    1    2
8 state4    1    0    2

我想将列附加到df1,这些列是var1,var2是该comp的所有状态的平均值。

因此,comp1的var1应为1 * 1 + 1 * 0 + 0 * 0 + 0 * 1 /(1 + 1)或状态* var / sum(comp的状态)按年份。

df3看起来像:

         state1 state2 state3 state4 year  var1  var2
    1 comp1  1      1      0      0     1   0.5   0.5
    2 comp2  0      1      1      0     1   0.0   0.5
    3 comp3  0      0      1      1     1   0.5   0.0
    4 comp1  1      1      0      0     2   0.5   1.0

这可能吗?我尝试使用ddply和var1的平均值,按照comp和year进行总结,但这并不起作用。我最终每个每年比赛有一行。

提前致谢。 这个与我的问题最相似,但它没有在第二个数据集中显示条件。 Multiply various subsets of a data frame by different vectors

请告知。

1 个答案:

答案 0 :(得分:1)

我希望通过将其划分为细分,您可以找出为什么我的结果看起来与您的预测不同:

 df3 <- matrix(NA, ncol=2, nrow=nrow(df1))
 for (i in seq(nrow(df1))) {
     df3[i, 1] <- sum(df2[ df2$year==df1$year[i], "var1"] * df1[i, 2:5])
     df3[i, 2] <- sum(df2[ df2$year==df1$year[i], "var2"] * df1[i, 2:5])
 }
 m4<-df3/rowSums(df1[2:5])
 cbind(df1, m4)
#---------------
   comp state1 state2 state3 state4 year   1         2
1 comp1      1      1      0      0    1 0.5 0.5000000
2 comp2      0      1      1      0    1 0.0 0.3333333
3 comp3      0      0      1      1    1 0.5 0.0000000
4 comp1      1      1      0      0    2 0.0 0.3333333

似乎在“var1”条目上匹配正确,我希望你只是对“var2”进行了一些猜测。