我有两个数据集(DT1和DT2),其中两个公共列分别名为“ CustomerID”和“日期”。我想通过这两个公共列在DT2上合并/左联接DT1。
这样做的时候,我在合并列中只得到了NA。为什么这样?
DT1
CustomerID Date NumberX
1 2018-09-01 1
2 2018-09-02 1
... ... ...
DT2
CustomerID Date Netsales
1 2018-09-01 100
2 2018-09-02 103
... ... ...
使用以下代码时:
new_DT <- merge(DT1, DT2, by = c("CustomerID", "Date"), all.x = T)
我得到:
new_DT
CustomerID Date NumberX Netsales
1 2018-09-01 1 NA
2 2018-09-02 1 NA
... ... ... ...
我不明白为什么所有这些都不适用?如前所述,由于客户在DT2中购买了几次,但一天仅一次,因此我想基于CustomerID和Date进行合并。