我有一个文件(名为example.txt),如下所示:
A B C
D E F
H I C
Z B Y
A B C
T E F
W O F
基于第2列,我想识别重复的行以获取以下文件:
H I C
W O F
答案 0 :(得分:0)
我们可以使用duplicated
df1[!(duplicated(df1$col2)|duplicated(df1$col2, fromLast=TRUE)),]
# col1 col2 col3
#3 H I C
#7 W O F
答案 1 :(得分:0)
您可以只计算出一次出现的值并选择这些行 - 如下所示:
Tab = table(df$V2)
Vals = unlist(attr(Tab, "dimnames"))[which(Tab == 1)]
df[df$V2 %in% Vals, ]
V1 V2 V3
3 H I C
7 W O F