R中非均匀,多变量的时间序列。

时间:2014-08-15 11:13:14

标签: r time-series

我的数据集的一小部分是:

 > df
   v1 v2 v3         v4
 1  1  0  1 03-11-2013
 2  5  2  0 09-11-2013
 3  4  2  0 12-11-2013
 4  2  6  1 14-11-2013
 5  3  0  1 21-11-2013
 6  0  0  1 24-11-2013

其中v4是非统一日期(实际数据明显更大)。目的是估计" v1"的下一个值。 (基于预先存在的信息,在这个非常简化的数据集中观察数字7)。最简单的可能只使用之前的v1值,但v1,v2和v3可能相关。因此,理想的情况是利用所有信息。

我在R中尝试了包预测()但是我发现处理非统一时间序列时遇到了困难。我也遇到了arima()函数/模型,但是它似乎只适用于统一的时间序列(?)。因此,问题是:

如何根据R中多个变量(包括我想预测的变量)的非均匀历史信息预测某个变量的值?

1 个答案:

答案 0 :(得分:1)

插入您的数据并尝试矢量自回归模型或忽略v2和v3,并从其(插值)历史记录中预测v1。两个软件包的作者都有书籍以获取更多信息。

library(zoo)
z <- read.zoo(DF, index = 4, format = "%d-%m-%Y")
g <- zoo(, seq(start(z), end(z), "day")) # grid
zz <- na.spline(merge(z, g))

# alternative 1. forcast all variables for next 10 days
library(vars)
fm <- VAR(zz)
predict(fm) # AR prediction of next 10 days

# alternative 2. univariate forecast disregarding v2 and v3
library(forecast)
forecast(zz$v1)