Question

我有一个文件（名为example.txt），如下所示：

A B C  
D E F  
H I C  
Z B Y  
A B C  
T E F  
W O F

基于第2列，我想识别重复的行以获取以下文件：

H I C  
W O F

Answer 1

我们可以使用duplicated

df1[!(duplicated(df1$col2)|duplicated(df1$col2, fromLast=TRUE)),]
#   col1 col2 col3
#3    H    I    C
#7    W    O    F

Answer 2

您可以只计算出一次出现的值并选择这些行 - 如下所示：

Tab = table(df$V2)
Vals = unlist(attr(Tab, "dimnames"))[which(Tab == 1)]
df[df$V2 %in% Vals, ]
  V1 V2 V3
3  H  I  C
7  W  O  F