Calulcate在一列时间戳上使用difftime运行时间差

时间:2015-12-17 11:39:10

标签: r difftime

如何计算连续两行时间戳的时差(以分钟为单位),并将结果添加到新列中。

我试过这个:

true

但只能从零时间开始获得差异。

添加了我想要添加的'mins'列的示例数据

data$hours <- as.numeric(floor(difftime(timestamps(data), (timestamps(data)[1]), units="mins")))

2 个答案:

答案 0 :(得分:5)

您与[1]一起使用的代码始终引用时间戳向量的第一个元素。

要做你想做的事,你想要看除除第一个元素之外的所有元素,除了最后一个元素之外的所有元素。

mytimes <- data.frame(timestamps=c("2013-06-23 00:00:00",
                                   "2013-06-23 01:00:00",
                                   "2013-06-23 02:00:00",
                                   "2013-06-23 04:00:00"),
                      mins=NA)
mytimes$mins <- c(NA, difftime(mytimes$timestamps[-1],
                               mytimes$timestamps[-nrow(mytimes)],
                               units="mins"))

此代码的作用是:

  1. 设置数据框,以便保持timestampsmins的长度相同。
  2. 在该数据框中,列出您拥有的时间戳以及您还没有任何分数(即NA)。
  3. 选择除时间戳mytimes$timestamps[-1]
  4. 的第一个元素之外的所有元素
  5. 选择除时间戳mytimes$timestamps[-nrow(mytimes)]
  6. 的最后一个元素之外的所有元素
  7. 以分钟为单位减去它们difftime(因为它们格式正确,您首先不必使它们成为POSIXct对象)。 units="mins"
  8. 将NA置于前面,因为与行c(NA, ...)
  9. 相比,差异较小
  10. 将所有内容放回原始数据框的分钟列mytimes$mins <-

答案 1 :(得分:2)

另一种选择是用这种方法计算它:

# create some data for an MWE
hrs <- c(0,1,2,4)

df <- data.frame(timestamps = as.POSIXct(paste("2015-12-17", 
                                            paste(hrs, "00", "00", sep = ":"))))

df
# timestamps
# 1 2015-12-17 00:00:00
# 2 2015-12-17 01:00:00
# 3 2015-12-17 02:00:00
# 4 2015-12-17 04:00:00

# create a function that calculates the lag for n periods
lag <- function(x, n) c(rep(NA, n), x[1:(length(x) - n)])

# create a new column named mins
df$mins <- as.numeric(df$timestamps - lag(df$timestamps, 1)) / 60

df
# timestamps mins
# 1 2015-12-17 00:00:00   NA
# 2 2015-12-17 01:00:00   60
# 3 2015-12-17 02:00:00   60
# 4 2015-12-17 04:00:00  120