我的数据集的一小部分是:
> df
v1 v2 v3 v4
1 1 0 1 03-11-2013
2 5 2 0 09-11-2013
3 4 2 0 12-11-2013
4 2 6 1 14-11-2013
5 3 0 1 21-11-2013
6 0 0 1 24-11-2013
其中v4是非统一日期(实际数据明显更大)。目的是估计" v1"的下一个值。 (基于预先存在的信息,在这个非常简化的数据集中观察数字7)。最简单的可能只使用之前的v1值,但v1,v2和v3可能相关。因此,理想的情况是利用所有信息。
我在R中尝试了包预测()但是我发现处理非统一时间序列时遇到了困难。我也遇到了arima()函数/模型,但是它似乎只适用于统一的时间序列(?)。因此,问题是:
如何根据R中多个变量(包括我想预测的变量)的非均匀历史信息预测某个变量的值?
答案 0 :(得分:1)
插入您的数据并尝试矢量自回归模型或忽略v2和v3,并从其(插值)历史记录中预测v1。两个软件包的作者都有书籍以获取更多信息。
library(zoo)
z <- read.zoo(DF, index = 4, format = "%d-%m-%Y")
g <- zoo(, seq(start(z), end(z), "day")) # grid
zz <- na.spline(merge(z, g))
# alternative 1. forcast all variables for next 10 days
library(vars)
fm <- VAR(zz)
predict(fm) # AR prediction of next 10 days
# alternative 2. univariate forecast disregarding v2 and v3
library(forecast)
forecast(zz$v1)