我有2个数据表,我想使用data.table
库进行合并。到目前为止,我得到的合并数据涉及很多重复项。我使用的伪代码可以在下面找到:
df <- data.frame("Code" = c(rep("REM",5),rep("REV",5),rep("RET",5)),"Num" = c(sample(15)))
df2 <- data.frame("Code" = c(rep("REM",5),rep("REV",5),rep("RET",5)),"Num" = c(sample(15)))
dt <- data.table(df)
dt2 <- data.table(df2)
merge(dt, dt2, by="Code", all = TRUE, allow.cartesian = TRUE)
如上所述,我得到了一些我想排除的重复项。所需的输出:
dfX <- data.frame("Code" = c(rep("REM",5),rep("REV",5),rep("RET",5)),"Num" = df[,2],"Num2"=df2[,2])