将data.frame乘以具有匹配条件的列

时间:2017-11-09 08:18:01

标签: r dataframe merge mapping multiplying

我想将df中的几列乘以另一个df中的列。

df1和df2有一个名为“year_quarter”的列。我希望df1中的许多列乘以df2中的列,以便year_quarter匹配。

df1

year_quarter   col1    col2    col3
2010Q1         5       0.34    0.45
2010Q1         4       0.45    0.34
2010Q1         6       0.63    0.86
2010Q1         2       0.75    0.45
2010Q2         3       0.78    0.27
2010Q2         5       0.43    0.38
2010Q2         2       0.34    0.74
2010Q2         1       0.87    0.35
2010Q3         5       0.34    0.45
2010Q3         8       0.54    0.42
2010Q3         9       0.23    0.45
2010Q3         3       0.74    0.34
2010Q4         2       0.72    0.78
2010Q4         7       0.62    0.91
2010Q4         2       0.74    0.10
2010Q4         6       0.73    0.09

DF2

year_quarter    ratio
2010Q1          0.96
2010Q2          1.34
2010Q3          1.92
2010Q4          0.74

我想将df1中的col1,col2和col3乘以df2中的比率,其中year_quarter在两个dfs中匹配。即如果df1 = 2010Q1中的quarter_year,则对于2010Q1的所有实例,col1,col2和col3应乘以0.96,依此类推。

2 个答案:

答案 0 :(得分:4)

我们可以使用match执行此操作。匹配两个数据框中的相似列,然后获取相应的ratio值,并将其乘以df1,不包括第1列。

df2$ratio[match(df1$year_quarter, df2$year_quarter)] * df1[-1]


#    col1   col2   col3
#1   4.80 0.3264 0.4320
#2   3.84 0.4320 0.3264
#3   5.76 0.6048 0.8256
#4   1.92 0.7200 0.4320
#5   4.02 1.0452 0.3618
#6   6.70 0.5762 0.5092
#7   2.68 0.4556 0.9916
#8   1.34 1.1658 0.4690
#9   9.60 0.6528 0.8640
#10 15.36 1.0368 0.8064
#11 17.28 0.4416 0.8640
#12  5.76 1.4208 0.6528
#13  1.48 0.5328 0.5772
#14  5.18 0.4588 0.6734
#15  1.48 0.5476 0.0740
#16  4.44 0.5402 0.0666

答案 1 :(得分:1)

使用dplyr,您合并两个数据集,然后应用mutate函数来更改所需列的值,如果您不需要%>% select(-ratio)

,最终可以删除比率列
library(dplyr)
left_join(df1, df2) %>% mutate_at(vars(starts_with("col")), funs(.*ratio))

左连接行为是这样的,例如,如果您在第一个data.frame中有一个2011日期,它将留下NA行(在Ronak的回答中表现相同)