R - 删除“一个接一个”重复

时间:2015-05-13 10:39:36

标签: r duplicates zoo

我试图找到一种方法来删除R语言中的成功重复项。我有一个zoo对象,如:

2015-01-01 12:00:00    1
2015-01-01 13:00:00    1
2015-01-01 14:00:00    1
2015-01-01 15:30:00    4
2015-01-01 16:00:00    1
2015-01-01 17:00:00    6

我的预期结果是:

2015-01-01 12:00:00    1
2015-01-01 15:30:00    4
2015-01-01 16:00:00    1
2015-01-01 17:00:00    6

当我使用duplicated-function时,它会在它们不连续出现时删除重复项(1)。

任何人都可以给我一个提示如何写这个或者是否已有功能?

2 个答案:

答案 0 :(得分:3)

您可以使用行程编码长度来挑选所需的行。如果在cumsum中使用raw,它将在序列中为您提供 last 值,但您可以通过从累积总和中减去长度并添加一个来获得第一个。

x <- data.frame(Date=Sys.Date()+0:5,Value=c(1,1,1,4,1,6))
lens <- rle(x$Value)$lengths
select <- cumsum(lens)-lens+1
x[select,]
        Date Value
1 2015-05-13     1
4 2015-05-16     4
5 2015-05-17     1
6 2015-05-18     6

答案 1 :(得分:2)

使用dplyr和lubridate,您可以按如下方式执行:

library(dplyr)
library(lubridate)

DF <- data.frame(Date=c("2015-01-01 12:00:00",
                        "2015-01-01 13:00:00","2015-01-01 15:30:00"),
                 name1=c(1, 1, 4))

DF %>%
  mutate(Date = ymd_hms(as.character(Date))) %>%
  filter(Date - hours(1) > lag(Date) | is.na(lag(Date)))

dplyr可让您引用上方的一行(lag),lubridate可让您计算日期。