我目前正在研究具有大量重复行的数据集。
我需要查看这些行以及从R中的duplicated()
函数中排除的唯一行。
我现在正在使用3个步骤来实现它:
dt1 <- dt %>%
filter(., duplicated(ID) == TRUE) %>%
mutate(., dup = 1)
dt <- left_join(dt, dt1, by = "ID")
然后
dt1 <- filter(dt, dup == 1)
因为我需要经常重复这些步骤。
所以我想知道是否有更简单的方法可以提供相同的输出?