Question

我的问题非常类似于Subset with unique cases, based on multiple columns。唯一的区别是我不希望重复的值显示在最终的数据框中。原始数据框：

df
v1  v2  v3   v4  v5
1  7   1   A  100  98 
2  7   2   A   98  97
3  8   1   C   NA  80
4  8   1   C   78  75
5  8   1   C   50  62
6  9   3   C   75  75

使用> df[!duplicated(df[1:3]),]让我

  v1 v2 v3  v4 v5
1  7  1  A 100 98
2  7  2  A  98 97
3  8  1  C  NA 80
6  9  3  C  75 75

但我想要的是

  v1 v2 v3  v4 v5
1  7  1  A 100 98
2  7  2  A  98 97

6  9  3  C  75 75

我尝试使用unique，但它似乎只是保留我正在分析的列。任何帮助将不胜感激！

Answer 1

我们还需要从另一端获取duplicated

df[!(duplicated(df[1:3])|duplicated(df[1:3], fromLast = TRUE)),]

如何摆脱dataframe专栏

1 个答案: