Question

我的工作是在一个特定阈值以下的数据框中查找连续值。首先，我从数据帧中提取了一个值低于阈值的子集。现在我的数据看起来像这样：

Value       dates
5105.47     1970-03-25
5398.53     1970-04-08
5520.65     1970-04-09
5052.68     1970-04-10
5406.77     1970-04-11
5501.05     1970-04-12

结果基本上是一个不规则的时间序列。现在我想确定连续的日期。有关怎么做的猜测？

Answer 1

你可以尝试

df1$consecutive <- c(NA,diff(as.Date(df1$dates))==1)
# > df1
#     Value      dates consecutive
# 1 5105.47 1970-03-25          NA
# 2 5398.53 1970-04-08       FALSE
# 3 5520.65 1970-04-09        TRUE
# 4 5052.68 1970-04-10        TRUE
# 5 5406.77 1970-04-11        TRUE
# 6 5501.05 1970-04-12        TRUE

通过将字符串转换为Date格式，可以执行简单的操作，例如取两个日期之间的差异。函数diff()将向量作为输入，并计算向量的每个条目v[i]与其先前条目v[i-1]之间的差异。差异向量显然比原始向量少一个条目。由于无法确定data.frame中的第一个日期是否为连续日期，因此可以合理地将其标识符设置为NA。

如果是日期，如果差异等于1则天数是连续的，而比较diff(as.Date(df1$dates))==1)的评估结果为TRUE。

数据

df1 <- structure(list(Value = c(5105.47, 5398.53, 5520.65, 5052.68, 5406.77, 5501.05), dates = structure(1:6, .Label = c("1970-03-25", "1970-04-08", "1970-04-09", "1970-04-10", "1970-04-11", "1970-04-12"), class = "factor")), .Names = c("Value", "dates"), class = "data.frame", row.names = c(NA, -6L))

R，查找，日期，连续

1 个答案: