我的代码下面有一个函数PositiveTBATS,它在一个时间序列上训练一个tbats模型,然后进行预测。该函数将日志转换应用于时间序列,在用0.001替换0后,以避免日志转换的-inf值。日志转换是为了使预测不会返回负值。然后我有另一段代码,它将函数并行化为多个时间序列。我遇到的问题是预测的高端似乎总是比实际数据低一点。我想知道是否有可以在tbats模型中调整的参数可能有助于在更高端获得更高的预测值。预测值较低,与实际数据非常接近。
##Parallelizing TBATS Model Training
## Making tbats forecast positive
PositiveTBATS<-function(y){
z<-replace(y,y==0,0.001)
x <- log(z)
fit <- tbats(x, use.box.cox=FALSE)
fit$lambda <- 0
fit$control$use.box.cox <- TRUE
fc <- forecast(fit,h=20)
fc$x <- exp(x)
fc
}
# Calculate the number of cores
no_cores <- floor(detectCores()/4)
# Initiate cluster
cl <- makeCluster(no_cores)
clusterEvalQ(cl, library(forecast))
tbatsList<-list(mts2DataTs1, mts2DataTs2)
tbatsModels<-parLapply(cl, tbatsList,
PositiveTBATS)
stopCluster(cl)
Data:
dput(mts2DataTs1[1:100])
c(50, 48, 47, 41, 33, 24, 23, 24, 25, 31, 36, 48, 56, 68, 79,
81, 87, 90, 81, 87, 90, 86, 79, 72, 60, 50, 39, 29, 30, 30, 31,
29, 31, 35, 44, 54, 71, 70, 83, 87, 93, 98, 104, 105, 101, 92,
94, 83, 76, 66, 64, 55, 48, 42, 38, 33, 34, 36, 47, 51, 58, 65,
71, 81, 89, 86, 89, 89, 86, 75, 73, 74, 57, 49, 41, 32, 33, 25,
24, 26, 28, 33, 42, 56, 61, 71, 74, 77, 84, 91, 90, 91, 91, 89,
93, 90, 79, 66, 66, 48)
dput(mts2DataTs2[1:100])
c(2, 2, 1, 0, 0, 1, 2, 0, 1, 4, 8, 7, 7, 6, 5, 5, 4, 3, 1, 5,
9, 5, 3, 2, 0, 0, 1, 0, 1, 0, 0, 2, 1, 5, 6, 5, 3, 2, 5, 4, 6,
5, 3, 4, 2, 5, 2, 1, 0, 4, 1, 2, 2, 2, 1, 1, 2, 1, 2, 7, 7, 3,
7, 3, 3, 2, 0, 4, 1, 3, 4, 1, 3, 0, 1, 3, 1, 0, 1, 3, 2, 4, 4,
2, 4, 5, 4, 3, 8, 3, 3, 5, 4, 3, 1, 1, 1, 2, 1, 1)
答案 0 :(得分:0)
您的数据是季节性的,但您没有在TBATS函数调用中指定季节性时段。您也不要在PositiveTBATS函数中对预测部分进行逆变换。
另外,我不会对你在这里提供的任何一个系列使用日志转换。你的第二个系列在训练数据中包含很多零,这里的零也不例外。如果您不想要负预测值,只需将预测截断为零。
像这样修改你的tbats功能,它会做你想要的。
PositiveTBATS<-function(y){
fit <- tbats(y, seasonal.periods = 24)
fc <- forecast(fit,h=20)
mean_fc <- pmax(fc$mean,0)
return(mean_fc)
}