我试图在r中联接两个表,但是尽管我使用了summarise(),但最终还是出现了一些重复。
注释: 我已经尝试过右,左和内联接
parent_id
我的摘要是否有理由不删除重复的分组?
提前谢谢!
答案 0 :(得分:0)
summarize
动词在您group_by()
之后计算合计。这是正确使用摘要的示例。
library(dplyr)
df1 <- data.frame(x = rep(c("Ag", "Ag", "Be", "Be", "Mo", "Mo"),2),
y = rep(c("A", "B", "A", "B", "A", "B"),2))
df1 %>%
group_by(x, y) %>%
summarize(count = n())
# A tibble: 6 x 3
# Groups: x [3]
x y count
<chr> <chr> <int>
1 Ag A 2
2 Ag B 2
3 Be A 2
4 Be B 2
5 Mo A 2
6 Mo B 2
您也可以使用distinct()
中的dplyr
删除重复项,或者也可以使用unique()
中的简单任务base
删除重复项。
df1 %>%
distinct()
x y
1 Ag A
2 Ag B
3 Be A
4 Be B
5 Mo A
6 Mo B
df1 %>%
unique()
x y
1 Ag A
2 Ag B
3 Be A
4 Be B
5 Mo A
6 Mo B