过滤日内数据R.

时间:2017-11-07 14:01:55

标签: r filter dplyr

我正在尝试过滤日内数据,以便仅包含当天的特定时段。在某些包中是否有一个技巧来实现这一目标。以下是示例数据:

library(tibbletime)

example <- as.tibble(data.frame(
  date = ymd_hms(seq(as.POSIXct("2017-01-01 09:00:00"), as.POSIXct("2017-01-02 20:00:00"), by="min")),
  value = rep(1, 2101)))

我想每天只包括10:00:00 - 18:35:00,但不能很好地实现这一目标。我现在的解决方案是创建额外的指示列,然后按它们进行过滤,但它也不能很好地工作。

3 个答案:

答案 0 :(得分:1)

您可以使用between()

中的data.table功能
example[data.table::between(format(example$date, "%H:%M:%S"), 
                            lower = "10:00:00",
                            upper = "18:35:00"), ]

答案 1 :(得分:0)

library(tibbletime)
library(tidyverse)
library(lubridate)

example <- as.tibble(data.frame(
  date = ymd_hms(seq(as.POSIXct("2017-01-01 09:00:00"), as.POSIXct("2017-01-02 20:00:00"), by="min")),
  value = rep(1, 2101)))

example %>%
  mutate(time = as.numeric(paste0(hour(date),".",minute(date)))) %>%
  filter(time >= 10 & time <= 18.35) %>%
  select(-time)

答案 2 :(得分:0)

这非常hacky但如果你真的想留在整齐的话:

rng <- range((hms("10:00:00") %>% as_datetime()), (hms("18:35:00") %>% as_datetime()))

example %>% 
  separate(., date, into = c("date", "time"), sep = " ") %>% 
  mutate(
    time = hms(time) %>% as_datetime(),
    date = as_date(date)
  ) %>% 
  filter(time > rng[1] & time < rng[2]) %>% 
  separate(., time, into = c("useless", "time"), sep = " ") %>% 
  select(-useless)