Question

查看此月度数据：

tsdata <- structure(c(9.55584, 42.31872, 17.064, 54.26352, 79.51824, 44.3664, 
                      82.58976, 129.6864, 70.64496, 102.384, 118.08288, 99.31248, 151.8696, 
                      172.68768, 129.34512), .Tsp = c(2015.25, 2016.41666666667, 12
                      ), class = "ts")

plot(tsdata)

然后，我将系列分为训练和测试集：

training <- structure(c(9.55584, 42.31872, 17.064, 54.26352, 79.51824, 44.3664, 
                        82.58976, 129.6864, 70.64496, 102.384, 118.08288, 99.31248),
                      .Tsp = c(2015.25, 2016.16666666667, 12), class = "ts")

test <- structure(c(151.8696, 172.68768, 129.34512), .Tsp = c(2016.25, 2016.41666666667, 12), class = "ts")

最后，我拟合tbats模型并计算MASE值

require(forecast)
fit <- tbats(training)
fcast <- forecast(fit)
accuracy(fcast, test)
                     ME     RMSE      MAE       MPE     MAPE MASE       ACF1 Theil's U
Training set -0.9012629 20.02206 16.33986 -22.70125 40.40976  NaN -0.3870826        NA
Test set     12.3136351 25.58155 24.77819   6.50544 16.14211  NaN -0.2992376  0.860442

您看到无法计算MASE。实际上，forecast包中的所有其他模型也输出NaN用于MASE。

为什么呢？ MASE指标对我来说非常重要，我想用它来比较我的时间序列数据的几个模型。

Answer 1

MASE使用在训练数据上计算的比例因子。对于季节性数据，默认比例因子是绝对季节差异的平均值。只有一年的数据，您无法计算季节差异，因此比例因子为NaN。

您可以使用基于第一个差异的缩放因子，如下所示：

accuracy(fcast, test, d=1, D=0)

但是，我刚注意到accuracy()中存在一个错误，这意味着d和D参数被忽略。它现在已修复，github上的版本将使用指定的参数。

R：为什么预测模型的MASE是NaN？

1 个答案: