排除2个Dataframes R的相同行

时间:2018-05-23 11:30:02

标签: r dataframe twitter

我有2个数据帧,包含有关df1 = sons,df = daughters的推文。 在分析时我碰巧注意到,有些行必须相同。

alltogether< - unique(rbind(df1,df2))表明确实有587行相同(通过从df1 + df2减去它) 如何识别它们?或者,更重要的是:从两个数据帧中排除它们?

2 个答案:

答案 0 :(得分:0)

我认为duplicated()是您正在寻找的。

df <- data.frame(1, c("A", "A", "B", "B"), c("A", "A", "B", "B"));
colnames(df) <- c("col1", "col2", "col3")
df
df[!duplicated(df),]

答案 1 :(得分:0)

我建议为每个存储有关数据框名称信息的数据框添加一列。例如。 df1$origin <- "df1"。然后,您可以rbind数据框。

然后,您可以使用duplicated来识别组合数据框中的重复行(不包括原始列)。然后可以删除找到的索引,剩余的数据框可以在origin列上拆分为原始部分。