将不同长度的数据帧与几个重复项进行比较并提取行

时间:2017-06-02 17:36:10

标签: r duplicates comparison row

我在Ubuntu 16.04上使用R版本3.2.3。 我有两个数据帧,我们可以调用DF1(716,757观测,6个变量)和DF2(716,733观测,6个变量)。我想比较DF1到DF2的每一行,以了解添加/删除了哪一行。问题是在一个数据帧中有几行是重复的,但是要及时排序。我的想法是比较DF1和DF2之间的每一行,并记录所有添加/删除的行。这样做有什么办法吗?请在下面找到我想要做的例子。

DF1

 V1       V2         V3          V4    V6        V7
C86      44     2016-01-01       A.1   X19    001:00:00
C86      44     2016-01-01       A.1   X19    001:00:00
C86      44     2016-01-01       A.1   X19    001:00:00
C86      44     2016-01-01       A.2   X19    000:15:00
C86      44     2016-01-01       A.2   X19    000:15:00
C86      44     2016-01-01       A.2   X19    000:15:00
C86      44     2016-01-01       A.1   Y18    000:45:00
C86      44     2016-01-01       A.2   Y18    000:15:00
B20      02     2016-01-01       A.1   Z85    003:00:00
B20      02     2016-01-01       A.2   Z85    000:40:00

DF2

 V1       V2         V3          V4    V6        V7
C86      44     2016-01-01       A.1   X19    001:00:00
C86      44     2016-01-01       A.1   X19    001:00:00
C86      44     2016-01-01       A.1   X19    001:00:00
C86      44     2016-01-01       A.2   X19    000:15:00
C86      44     2016-01-01       A.1   Y18    000:45:00
C86      44     2016-01-01       A.2   Y18    000:15:00
C86      44     2016-01-01       A.1   Y18    000:15:00
B20      02     2016-01-01       A.1   Z85    003:00:00
B20      02     2016-01-01       A.2   Z85    000:40:00

输出缺失/添加

 V1       V2         V3          V4    V6        V7
C86      44     2016-01-01       A.2   X19    000:15:00 (missing in DF2)
C86      44     2016-01-01       A.2   X19    000:15:00 (missing in DF2)
C86      44     2016-01-01       A.1   Y18    000:15:00 (added in DF2)

0 个答案:

没有答案