R:基于一列排除所有重复行(每对的两个)

时间:2017-04-06 14:26:31

标签: bash

我有一个文件(名为example.txt),如下所示:

A B C  
D E F  
H I C  
Z B Y  
A B C  
T E F  
W O F  

基于第2列,我想识别重复的行以获取以下文件:

H I C  
W O F

2 个答案:

答案 0 :(得分:0)

我们可以使用duplicated

df1[!(duplicated(df1$col2)|duplicated(df1$col2, fromLast=TRUE)),]
#   col1 col2 col3
#3    H    I    C
#7    W    O    F

答案 1 :(得分:0)

您可以只计算出一次出现的值并选择这些行 - 如下所示:

Tab = table(df$V2)
Vals = unlist(attr(Tab, "dimnames"))[which(Tab == 1)]
df[df$V2 %in% Vals, ]
  V1 V2 V3
3  H  I  C
7  W  O  F