R:为什么预测模型的MASE是NaN?

时间:2016-07-29 01:15:55

标签: r time-series forecasting

查看此月度数据:

tsdata <- structure(c(9.55584, 42.31872, 17.064, 54.26352, 79.51824, 44.3664, 
                      82.58976, 129.6864, 70.64496, 102.384, 118.08288, 99.31248, 151.8696, 
                      172.68768, 129.34512), .Tsp = c(2015.25, 2016.41666666667, 12
                      ), class = "ts")

plot(tsdata)

enter image description here

然后,我将系列分为训练和测试集:

training <- structure(c(9.55584, 42.31872, 17.064, 54.26352, 79.51824, 44.3664, 
                        82.58976, 129.6864, 70.64496, 102.384, 118.08288, 99.31248),
                      .Tsp = c(2015.25, 2016.16666666667, 12), class = "ts")

test <- structure(c(151.8696, 172.68768, 129.34512), .Tsp = c(2016.25, 2016.41666666667, 12), class = "ts")

最后,我拟合tbats模型并计算MASE值

require(forecast)
fit <- tbats(training)
fcast <- forecast(fit)
accuracy(fcast, test)
                     ME     RMSE      MAE       MPE     MAPE MASE       ACF1 Theil's U
Training set -0.9012629 20.02206 16.33986 -22.70125 40.40976  NaN -0.3870826        NA
Test set     12.3136351 25.58155 24.77819   6.50544 16.14211  NaN -0.2992376  0.860442

您看到无法计算MASE。实际上,forecast包中的所有其他模型也输出NaN用于MASE。

为什么呢? MASE指标对我来说非常重要,我想用它来比较我的时间序列数据的几个模型。

1 个答案:

答案 0 :(得分:2)

MASE使用在训练数据上计算的比例因子。对于季节性数据,默认比例因子是绝对季节差异的平均值。只有一年的数据,您无法计算季节差异,因此比例因子为NaN。

您可以使用基于第一个差异的缩放因子,如下所示:

accuracy(fcast, test, d=1, D=0)

但是,我刚注意到accuracy()中存在一个错误,这意味着dD参数被忽略。它现在已修复,github上的版本将使用指定的参数。