两个数据重复测试

时间:2017-08-02 07:21:31

标签: r duplicates data-manipulation

如果我有2个具有相同列名的数据,并且我想检查不同的观察,我该怎么办?

以下是我的示例数据:

# dt1
ID  Name  ColA   ColB
2   Peter 1      2
4   Freda 50     4
5   Jean  8      10

# dt2
ID  Name  ColA   ColB  ColC   ColD
1   Roger 1      2     400
2   Peter 1      2     500    2000
3   Tina  3      50           20
4   Freda 50     4     500    300
5   Jean  8      10    89     54

ColAColBColCColD并不重要。我只想查看IDName

其次,检查dt2哪些行与dt1不同。
因此,结果是:

ID  Name  ColA   ColB  ColC   ColD
1   Roger 1      2     400
3   Tina  3      50           20

因为我的真实数据非常大,我该怎么检查?

1 个答案:

答案 0 :(得分:2)

> library(dplyr) 
> anti_join(dt2,dt1,by=c('ID','Name'))