条件合并表

时间:2014-11-12 19:58:15

标签: r date merge data.table aggregate

我有2个表:

    Time      X1  
  8/1/2013    56 
  9/1/2013    14   
  10/1/2013    8  
  11/1/2013    4  
  12/1/2013   78  

    Time      X2  
  8/1/2013    42 
  9/1/2013    44   
  10/1/2013    2  
  11/1/2013   75  
  12/1/2013   36 

如何将这两个表合并在一个表中按“时间”分组但有一个条件:第一个表的月份必须与下一个月的第二个月匹配 - 如第一个表中的九月应该与第二个表中的十月匹配

谢谢!

1 个答案:

答案 0 :(得分:4)

这是data.table rolling join

的完美工作
library(data.table)
setkey(setDT(dat1)[, Time := as.Date(Time, format = "%m/%d/%Y")], Time)
setkey(setDT(dat2)[, Time := as.Date(Time, format = "%m/%d/%Y") - 1], Time)
dat2[dat1, roll = -Inf]
#          Time X2 X1
# 1: 2013-08-01 44 56
# 2: 2013-09-01  2 14
# 3: 2013-10-01 75  8
# 4: 2013-11-01 36  4
# 5: 2013-12-01 NA 78

修改:如果您不想要不匹配的行,请使用nomatch = 0

dat2[dat1, roll = -Inf, nomatch = 0]
#          Time X2 X1
# 1: 2013-08-01 44 56
# 2: 2013-09-01  2 14
# 3: 2013-10-01 75  8
# 4: 2013-11-01 36  4