通过从R中的数据帧中删除成对重复项来提取唯一的组合行

时间:2018-09-01 15:58:08

标签: r

即使两列值相同,我也想从数据帧(df)中删除重复项,即使这些值的顺序相反。我的实际数据集也有7046行。

这是示例数据,

all

我想生成一个没有重复的新数据帧,例如,第1行和第2行与第3、4、5、6行相同,因为它们具有相同的信息,所以我希望没有重复的最终文件像下面这样的文件:

library(dplyr)
a %>% 
  group_by(grp = cumsum(year == 1999)) %>%
  filter(dplyr::first(year) == 1999, 
         dplyr::last(year) == 2002, 
         all(1999:2002 %in% year)) %>%
  ungroup %>% # in case to remove the 'grp'
  select(-grp)
# A tibble: 8 x 2
#   year    id
#  <int> <dbl>
#1  1999     1
#2  2000     3
#3  2001     5
#4  2002     7
#5  1999     4
#6  2000     2
#7  2001     0
#8  2002    -1

有人可以帮忙吗?唯一的命令无法与此配合使用,我也不知道该怎么做。

我尝试过

> df
part_no.   alt_part_no
    1           2
    1           3
    2           1
    2           3
    3           1
    3           2
    4           5
    5           4
    6           7
    6           8
    6           9
    7           6
    7           8  
    7           9
    8           6
    8           7
    8           9
    9           6
    9           7 
    9           8

0 个答案:

没有答案