我的问题非常类似于Subset with unique cases, based on multiple columns。唯一的区别是我不希望重复的值显示在最终的数据框中。 原始数据框:
df
v1 v2 v3 v4 v5
1 7 1 A 100 98
2 7 2 A 98 97
3 8 1 C NA 80
4 8 1 C 78 75
5 8 1 C 50 62
6 9 3 C 75 75
使用> df[!duplicated(df[1:3]),]
让我
v1 v2 v3 v4 v5
1 7 1 A 100 98
2 7 2 A 98 97
3 8 1 C NA 80
6 9 3 C 75 75
但我想要的是
v1 v2 v3 v4 v5
1 7 1 A 100 98
2 7 2 A 98 97
6 9 3 C 75 75
我尝试使用unique,但它似乎只是保留我正在分析的列。任何帮助将不胜感激!
答案 0 :(得分:1)
我们还需要从另一端获取duplicated
df[!(duplicated(df[1:3])|duplicated(df[1:3], fromLast = TRUE)),]