即使两列值相同,我也想从数据帧(df)中删除重复项,即使这些值的顺序相反。我的实际数据集也有7046行。
这是示例数据,
all
我想生成一个没有重复的新数据帧,例如,第1行和第2行与第3、4、5、6行相同,因为它们具有相同的信息,所以我希望没有重复的最终文件像下面这样的文件:
library(dplyr)
a %>%
group_by(grp = cumsum(year == 1999)) %>%
filter(dplyr::first(year) == 1999,
dplyr::last(year) == 2002,
all(1999:2002 %in% year)) %>%
ungroup %>% # in case to remove the 'grp'
select(-grp)
# A tibble: 8 x 2
# year id
# <int> <dbl>
#1 1999 1
#2 2000 3
#3 2001 5
#4 2002 7
#5 1999 4
#6 2000 2
#7 2001 0
#8 2002 -1
有人可以帮忙吗?唯一的命令无法与此配合使用,我也不知道该怎么做。
我尝试过
> df
part_no. alt_part_no
1 2
1 3
2 1
2 3
3 1
3 2
4 5
5 4
6 7
6 8
6 9
7 6
7 8
7 9
8 6
8 7
8 9
9 6
9 7
9 8