如何从滚动回归中提取残差标准误差

时间:2020-04-03 13:37:17

标签: r return regression rolling-computation standard-error

我正在尝试获取滚动回归的残差标准偏差(R汇总中的残差标准误差)。我正在尝试在总共4000天的20天的股票收益中进行滚动回归。我可以进行滚动回归,并且可以从常规lm回归中获得残差标准差,但不能进行滚动回归。 我的数据类似于以下内容,其中数据框具有多只股票的收益,向量是指数收益:

data<-as.data.frame(matrix(rexp(20000, rate=.1), ncol=20))

vector<-rexp(1000,rate=0.1)

我可以为lm回归生成一个西格玛:sigma(lm(data$V1~vector))

我可以使用library(roll)roll_lm(vector,data$V1,width=20)以及library(rollRegres)roll_regres(data$V1~vector,width=20)进行滚动回归

有没有办法从这种滚动回归中获得残余标准误差/残余标准偏差/ sigma?

我希望得到一个仅包含残留标准偏差的数据框。

谢谢!

1 个答案:

答案 0 :(得分:0)

如果您阅读了summary.lm的代码,则残余标准误差为残余平方和(rss)/残余自由度(rdf)的平方根。由于roll_lm不能保留此值,因此您需要使用系数来获取预测值并再次进行计算:

data<-as.data.frame(matrix(rexp(20000, rate=.1), ncol=20))
vector<-rexp(1000,rate=0.1)

library(roll)
WI = 20
rlm = roll_lm(vector,data$V1,width=WI)
rdf = WI - ncol(rlm$coefficients)

下面,我们浏览每个窗口,获取预测并计算rss,然后从中获得sigma:

sigma = sapply(1:(nrow(data)-WI+1),function(i){
# basically intercept + predictor * coef
pred = cbind(rep(1,WI),vector[i:(i+WI-1)]) %*% rlm$coefficients[WI+i-1,]
rss = sum((data$V1[i:(i+WI-1)] - pred)^2)
sqrt(rss/rdf)
})

我们可以将其包装在一个函数中,该函数将x,y作为输入:

roll_w_sigm = function(x,y,WI=20){

rlm = roll_lm(x=vector,y=y,width=WI)
rdf = WI - ncol(rlm$coefficients)

rlm$sigma = sapply(1:(length(y)-WI+1),function(i){
    pred = cbind(rep(1,WI),vector[i:(i+WI-1)]) %*% rlm$coefficients[WI+i-1,]
    rss = sum((y[i:(i+WI-1)] - pred)^2)
    sqrt(rss/rdf)
    })
rlm
}

对于1列:

res = roll_w_sigm(vector,data$V1)
head(res$sigma)
[1] 9.102188 9.297425 9.324338 9.509460 7.849201 7.993087

对于所有列:

lapply(data,function(i)roll_w_sigm(vector,i))