我正在尝试对R中的动态时间序列进行滚动预测(然后计算出预测的平方误差)。我在this StackOverflow question上建了很多代码,但我对R很新,所以我很挣扎。任何帮助将非常感激。
require(zoo)
require(dynlm)
set.seed(12345)
#create variables
x<-rnorm(mean=3,sd=2,100)
y<-rep(NA,100)
y[1]<-x[1]
for(i in 2:100) y[i]=1+x[i-1]+0.5*y[i-1]+rnorm(1,0,0.5)
int<-1:100
dummydata<-data.frame(int=int,x=x,y=y)
zoodata<-as.zoo(dummydata)
prediction<-function(series)
{
mod<-dynlm(formula = y ~ L(y) + L(x), data = series) #get model
nextOb<-nrow(series)+1
#make forecast
predicted<-coef(mod)[1]+coef(mod)[2]*zoodata$y[nextOb-1]+coef(mod)[3]*zoodata$x[nextOb-1]
#strip timeseries information
attributes(predicted)<-NULL
return(predicted)
}
rolling<-rollapply(zoodata,width=40,FUN=prediction,by.column=FALSE)
返回:
20 21 ..... 80
10.18676 10.18676 10.18676
有两个我没想到的问题:
我做错了什么?是否有更简单的方法来进行预测而不是全部写出来?谢谢!
答案 0 :(得分:2)
您的函数的主要问题是data
的{{1}}参数。如果查看dynlm
,您会看到?dynlm
参数必须是data
或data.frame
对象。不幸的是,我刚刚了解到zoo
将rollapply
个对象拆分为zoo
个对象。这意味着array
在注意到您的dynlm
参数形式不正确后,在全球环境中搜索了data
和x
当然,这是在代码的顶部定义的。解决方案是将y
转换为series
对象。你的代码还有其他几个问题,我在这里发布了一个更正版本:
zoo
关于结果编号的第二个问题可由prediction<-function(series) {
mod <- dynlm(formula = y ~ L(y) + L(x), data = as.zoo(series)) # get model
# nextOb <- nrow(series)+1 # This will always be 21. I think you mean:
nextOb <- max(series[,'int'])+1 # To get the first row that follows the window
if (nextOb<=nrow(zoodata)) { # You won't predict the last one
# make forecast
# predicted<-coef(mod)[1]+coef(mod)[2]*zoodata$y[nextOb-1]+coef(mod)[3]*zoodata$x[nextOb-1]
# That would work, but there is a very nice function called predict
predicted=predict(mod,newdata=data.frame(x=zoodata[nextOb,'x'],y=zoodata[nextOb,'y']))
# I'm not sure why you used nextOb-1
attributes(predicted)<-NULL
# I added the square error as well as the prediction.
c(predicted=predicted,square.res=(predicted-zoodata[nextOb,'y'])^2)
}
}
rollapply(zoodata,width=20,FUN=prediction,by.column=F,align='right')
参数align
控制。 rollapply
会给你left
,1..60
(默认)会给你center
而20..80
会给你right
。