我想将df中的几列乘以另一个df中的列。
df1和df2有一个名为“year_quarter”的列。我希望df1中的许多列乘以df2中的列,以便year_quarter匹配。
df1
year_quarter col1 col2 col3
2010Q1 5 0.34 0.45
2010Q1 4 0.45 0.34
2010Q1 6 0.63 0.86
2010Q1 2 0.75 0.45
2010Q2 3 0.78 0.27
2010Q2 5 0.43 0.38
2010Q2 2 0.34 0.74
2010Q2 1 0.87 0.35
2010Q3 5 0.34 0.45
2010Q3 8 0.54 0.42
2010Q3 9 0.23 0.45
2010Q3 3 0.74 0.34
2010Q4 2 0.72 0.78
2010Q4 7 0.62 0.91
2010Q4 2 0.74 0.10
2010Q4 6 0.73 0.09
DF2
year_quarter ratio
2010Q1 0.96
2010Q2 1.34
2010Q3 1.92
2010Q4 0.74
我想将df1中的col1,col2和col3乘以df2中的比率,其中year_quarter在两个dfs中匹配。即如果df1 = 2010Q1中的quarter_year,则对于2010Q1的所有实例,col1,col2和col3应乘以0.96,依此类推。
答案 0 :(得分:4)
我们可以使用match
执行此操作。匹配两个数据框中的相似列,然后获取相应的ratio
值,并将其乘以df1
,不包括第1列。
df2$ratio[match(df1$year_quarter, df2$year_quarter)] * df1[-1]
# col1 col2 col3
#1 4.80 0.3264 0.4320
#2 3.84 0.4320 0.3264
#3 5.76 0.6048 0.8256
#4 1.92 0.7200 0.4320
#5 4.02 1.0452 0.3618
#6 6.70 0.5762 0.5092
#7 2.68 0.4556 0.9916
#8 1.34 1.1658 0.4690
#9 9.60 0.6528 0.8640
#10 15.36 1.0368 0.8064
#11 17.28 0.4416 0.8640
#12 5.76 1.4208 0.6528
#13 1.48 0.5328 0.5772
#14 5.18 0.4588 0.6734
#15 1.48 0.5476 0.0740
#16 4.44 0.5402 0.0666
答案 1 :(得分:1)
使用dplyr,您合并两个数据集,然后应用mutate函数来更改所需列的值,如果您不需要%>% select(-ratio)
library(dplyr)
left_join(df1, df2) %>% mutate_at(vars(starts_with("col")), funs(.*ratio))
左连接行为是这样的,例如,如果您在第一个data.frame中有一个2011日期,它将留下NA行(在Ronak的回答中表现相同)