如何查找重复项,包括第一次出现

时间:2013-09-25 06:44:45

标签: r duplicate-detection

我有这个载体

vector <- c("www.one","www.two","www.one","www.three")

我希望找到所有重复项,包括第一次出现的重复值。如果我做

dup <- duplicated(vector)

我得到了

dup
# [1] FALSE FALSE  TRUE FALSE

虽然我需要

# [1] TRUE FALSE  TRUE FALSE

2 个答案:

答案 0 :(得分:6)

您可以拨打duplicated两次,从前面和后面查找重复项。

duplicated(vector) | duplicated(vector, fromLast=TRUE)
# [1]  TRUE FALSE  TRUE FALSE

答案 1 :(得分:0)

这是另一种方式:

Rgames> foo<-c('a','b','d','f','a','b','b','q')
Rgames> which(foo%in%foo[which(duplicated(foo))])
[1] 1 2 5 6 7