有条件地加入DPLYR

时间:2015-07-26 11:25:50

标签: r join conditional dplyr

我试图通过一个变量来连接两个数据帧,该变量具有不同的名称和源中的单个条件标准(即年份)。

调查各种解决方案并未给我答案。

数据

x_6.0_2011 <- data.frame(t = c("1", "2", "3", "7"), value_1 = c("0.9", "0.6", "0.1", "0.8"))

x <- data.frame(year = c("2010", "2011", "2012", "2013"), t.nr = c("1", "1", "2", "7"), value = c("0.2", "0.5", "0.7", "0.3"))

我尝试了什么:

x2011 <-   ifelse(x$year == '2011', 
                  left_join(x, x_6.0_2011, by = c('t.nr' = 't')), 0)

- &GT;产生一个列表 - 错误的解决方案路径

x20111 <- left_join(x, x_6.0_2011, by = c('t.nr' = 't'), ,year== 2011 )

- &GT;产生一个df但只替换正确的值并在x_6.0_2011中的余数中进行加密 - 所以错误的解决方案路径

xx_6.02011 <- left_join(filter(x, year == '2011'), x_6.0_2011, by = c('t.nr' = 't'))

- &GT;用一行产生df,但我希望保留其他不包含任何值的条目

结果预期:

Yr       t.nr   value  value_1
2010     1       0.2    0
2011     1       0.3    0.9
2012     2       0.7    0
2013     7       0.3    0

......或者至少在最后一列中是类似的,而不是我无法推断的值。

最小的例子可行但是我的工作项目(217变量)仍然会产生错误:

我一直得到: 错误:data_frames只能包含1d原子向量和列表

任何建议都不仅仅是值得赞赏的。或者我的尝试是否过于简单?

1 个答案:

答案 0 :(得分:2)

您可以使用devel

data.table版本
library(data.table)#v1.9.5+
setDT(df1)[df2, on=c('t'='t.nr')][year!=2011, value_1:='0'][]
#    t value_1 year value
#1: 1       0 2010   0.2
#2: 1     0.9 2011   0.5
#3: 2       0 2012   0.7
#4: 7       0 2013   0.3