我正在进行一些循环分析。
我有变量X,如果处于收缩状态则为true,否则为
X
##[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
...
我通过
改为0&1和#1X2<-as.ts(X*1)
然后我有一个日期序列。
td
## [1] "2000-01-31" "2000-02-29" "2000-03-31" "2000-04-30" "2000-05-31" "2000-06-30"
...
然后我使用了动物园&#39;用订单td索引X2
。
library(zoo)
na_ts = zoo(x=X2, order.by=td)
现在是我的问题。我想确定值变化的日期,并计算系列保持为1和0的时间。
如此理想的结果:
start end type duration
2000-01-31 - 2001-05-31 contraction 17 months
2001-06-30 - 2004-05-31 expansion ....
请问有人帮帮我吗?提前谢谢了。
答案 0 :(得分:1)
您可以使用X
的游程编码将时间序列拆分为具有相同值的连续元素:
# Reproducible example
X <- c(F, F, F, T, T, F)
td <- c( "2000-01-31", "2000-02-29", "2000-03-31", "2000-04-30", "2000-05-31", "2000-06-30")
library(zoo)
na_ts = zoo(x=X, order.by=td)
# Split with run-length encoding
runlens <- rle(X)
(ts.spl <- split(na_ts, rep(seq_along(runlens$lengths), times=runlens$lengths)))
# $`1`
# 2000-01-31 2000-02-29 2000-03-31
# FALSE FALSE FALSE
#
# $`2`
# 2000-04-30 2000-05-31
# TRUE TRUE
#
# $`3`
# 2000-06-30
# FALSE
现在,您可以从列表ts.spl
中存储的每个时间序列中提取所需的任何信息。例如:
dat <- data.frame(start = sapply(ts.spl, start),
end = sapply(ts.spl, end),
val = ifelse(runlens$values, "contraction", "expansion"))
dat$days <- as.numeric(as.Date(dat$end) - as.Date(dat$start), units="days")
dat
# start end val days
# 1 2000-01-31 2000-03-31 expansion 60
# 2 2000-04-30 2000-05-31 contraction 31
# 3 2000-06-30 2000-06-30 expansion 0
这种方法是split-apply-combine的一个例子,我们根据数据的某些属性拆分原始数据,应用函数提取每个部分感兴趣的信息,然后将它们组合在一起。
答案 1 :(得分:0)
这是我稍作修改后的代码。谢谢josilber! 我们通常在周期性分析中处理月度数据,因为最多几天不准确。经济也可能陷入衰退/扩张,因此不会出现零。
na_ts = zoo(x=X, order.by=td)
# Split with run-length encoding
runlens <- rle(X)
(ts.spl <- split(na_ts, rep(seq_along(runlens$lengths), times=runlens$lengths)))
dat <- data.frame(start = sapply(ts.spl, start),
end = sapply(ts.spl, end),
val = ifelse(runlens$values, "contraction", "expansion"))
dat$months<- runlens$lengths
dat