Question

我试图在数据框的列上使用滞后，但是当涉及时间时它就不会工作了。我尝试过shift，lag和tlag。

示例：

y = strptime(sprintf("%s:%s:%s", 4, 20, 10), "%H:%M:%S")
yy = strptime(sprintf("%s:%s:%s", 10, 20, 10), "%H:%M:%S")
lag(c(y,yy))

格式错误.POSIXlt（x，usetz = usetz）：＆＃34; POSIXlt＆＃34;中的无效组件[[10]]应该是＆＃39; zone＆＃39;

tlag(c(y,yy))

n_distinct_multi（list（...），na.rm）中的错误：争论＆＃34;时间＆＃34;缺少，没有默认

shift(c(y,yy))
[[1]]
[1] NA 10

[[2]]
[1] NA 20

[[3]]
[1] NA  4

[[4]]
[1] NA  4

[[5]]
[1] NA  6

[[6]]
[1]  NA 117

[[7]]
[1] NA  2

[[8]]
[1]  NA 184

[[9]]
[1] NA  1

[[10]]
[1] NA    "BST"

[[11]]
[1]   NA 3600

我不想要任何时间差异，我只想要数据框中上面一行的值，我认为这是滞后所做的：＆＃34;超前和滞后对于比较偏移的值是有用的常数（例如前一个或下一个值）＆＃34;。时间不应该重要，它应该只选择前一个位置的数字/字符/时间。我如何解决这个问题，或者是否有一个与我喜欢的功能相同的功能 - 我不想涉及任何循环，因为速度很重要且数据帧很大。

我的数据框示例：

structure(list(sec = c(52, 53, 54, 55, 56, 57, 58, 59, 0, 1), 
    min = c(50L, 50L, 50L, 50L, 50L, 50L, 50L, 50L, 51L, 51L), 
    hour = c(11L, 11L, 11L, 11L, 11L, 11L, 11L, 11L, 11L, 11L
    ), mday = c(4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L), mon = c(6L, 
    6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L), year = c(117L, 117L, 
    117L, 117L, 117L, 117L, 117L, 117L, 117L, 117L), wday = c(2L, 
    2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), yday = c(184L, 184L, 
    184L, 184L, 184L, 184L, 184L, 184L, 184L, 184L), isdst = c(1L, 
    1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L), zone = c("BST", "BST", 
    "BST", "BST", "BST", "BST", "BST", "BST", "BST", "BST"), 
    gmtoff = c(NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_)), .Names = c("sec", "min", "hour", "mday", "mon", 
"year", "wday", "yday", "isdst", "zone", "gmtoff"), class = c("POSIXlt", 
"POSIXt"))

Answer 1

对于data.frame，如下所示

  index                time
1     1 2017-07-04 04:20:10
2     2 2017-07-04 10:20:10

您可以使用dplyr

dplyr::lag(df$time, 1)
[1] NA                         "2017-07-04 04:20:10 CEST"

dplyr::lead(df$time, 1)
[1] "2017-07-04 10:20:10 CEST" NA

要将潜在客户/滞后列添加到data.frame，您可以使用

dplyr::mutate(df, lead_1 = dplyr::lead(time, 1), lag_1 = dplyr::lag(time, 1))
  index                time              lead_1               lag_1
1     1 2017-07-04 04:20:10 2017-07-04 10:20:10                <NA>
2     2 2017-07-04 10:20:10                <NA> 2017-07-04 04:20:10

R导联和滞后（移位）随着时间的推移

1 个答案: