R摘要不会从联接结果中删除重复项

时间:2020-08-11 23:59:05

标签: r join dplyr

我试图在r中联接两个表,但是尽管我使用了summarise(),但最终还是出现了一些重复。

example screenshot

注释: 我已经尝试过右,左和内联接

parent_id

我的摘要是否有理由不删除重复的分组?

提前谢谢!

1 个答案:

答案 0 :(得分:0)

summarize动词在您group_by()之后计算合计。这是正确使用摘要的示例。

library(dplyr)
df1 <- data.frame(x = rep(c("Ag", "Ag", "Be", "Be", "Mo", "Mo"),2),
              y = rep(c("A", "B", "A", "B", "A", "B"),2))
df1 %>% 
  group_by(x, y) %>%
  summarize(count = n())
# A tibble: 6 x 3
# Groups:   x [3]
  x     y     count
  <chr> <chr> <int>
1 Ag    A         2
2 Ag    B         2
3 Be    A         2
4 Be    B         2
5 Mo    A         2
6 Mo    B         2

您也可以使用distinct()中的dplyr删除重复项,或者也可以使用unique()中的简单任务base删除重复项。

df1 %>%
  distinct()
   x y
1 Ag A
2 Ag B
3 Be A
4 Be B
5 Mo A
6 Mo B

df1 %>%
  unique()
   x y
1 Ag A
2 Ag B
3 Be A
4 Be B
5 Mo A
6 Mo B