寓言中的预测功能是否提供单步预测?

时间:2020-10-12 14:49:46

标签: r forecasting fable-r

here所述,在测试集中进行单步预测是一种避免随着预测范围增加而不可避免地增加方差的方法。在该部分中提到的方法是使用已经训练好的模型对forecast包对测试集执行一步预测。是否有使用更新的fable包对测试数据执行单步预测的类似方法?也许here, for example中描述的new_data参数可以解决此问题,但是我不确定,因为h = 24new_data = x_test的预测如下:

> library(fable)
> library(fabletools)
> x <- USAccDeaths %>%
+   as_tsibble()
> x
# A tsibble: 72 x 2 [1M]
      index value
      <mth> <dbl>
 1 1973 Jan  9007
 2 1973 Feb  8106
 3 1973 Mar  8928
 4 1973 Apr  9137
 5 1973 May 10017
 6 1973 Jun 10826
 7 1973 Jul 11317
 8 1973 Aug 10744
 9 1973 Sep  9713
10 1973 Oct  9938
# … with 62 more rows
> x_train <- x %>% filter(year(index) < 1977)
> x_test <- x %>% filter(year(index) >= 1977)
> fit <- x_train %>% model(arima = ARIMA(log(value) ~ pdq(0, 1, 1) + PDQ(0, 1, 1)))
> fit
# A mable: 1 x 1
                      arima
                    <model>
1 <ARIMA(0,1,1)(0,1,1)[12]>
> nrow(x_test)
[1] 24
> forecast(fit, h = 24)$.mean
 [1]  7778.052  7268.527  7831.507  7916.845  8769.478  9144.790 10004.816  9326.874  8172.226
[10]  8527.355  8015.100  8378.166  7692.356  7191.343  7751.466  7839.085  8686.833  9062.247
[19]  9918.487  9250.101  8108.202  8463.933  7958.667  8322.497
> forecast(fit, new_data = x_test)$.mean
 [1]  7778.052  7268.527  7831.507  7916.845  8769.478  9144.790 10004.816  9326.874  8172.226
[10]  8527.355  8015.100  8378.166  7692.356  7191.343  7751.466  7839.085  8686.833  9062.247
[19]  9918.487  9250.101  8108.202  8463.933  7958.667  8322.497

1 个答案:

答案 0 :(得分:1)

答案和代码

model包中的许多模型可用的{forecast}自变量等效于refit()包中的{fable}方法。当与将来的数据一起使用时,它可以用于根据模型生成多个单步预测。

library(forecast)
fit <- head(USAccDeaths, -24) %>% 
  auto.arima()
fit_test <- tail(USAccDeaths, 24) %>% 
  Arima(model = fit)
accuracy(fit_test)
#>                    ME     RMSE      MAE       MPE      MAPE      MASE
#> Training set 22.45098 167.0648 85.59724 0.2382773 0.9327587 0.3298545
#>                    ACF1
#> Training set -0.0968173

library(fable)
library(dplyr)
us_accidental_deaths <- as_tsibble(USAccDeaths)
fit <- head(us_accidental_deaths, -24) %>% 
  model(ARIMA(value))
fit_test <- refit(fit, tail(us_accidental_deaths, 24), reestimate = FALSE)
accuracy(fit_test)
#> # A tibble: 1 x 10
#>   .model       .type       ME  RMSE   MAE   MPE  MAPE  MASE RMSSE    ACF1
#>   <chr>        <chr>    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>   <dbl>
#> 1 ARIMA(value) Training  22.5  167.  85.6 0.238 0.933 0.330 0.490 -0.0968

reprex package(v0.3.0)于2020-10-13创建

说明

模型的fitted()值是提前一步的预测,可用于评估“训练准确性”性能(训练数据的预测准确性)。但是有一个问题-模型的估计参数是基于整个训练集的,因此训练的准确性比预期的要好(该模型包含有关适合的未来的一些信息)。

forecast()函数用于生成模型从未见过的未来时间点的预测。您可以使用forecast(<mable>, h = 1)来生成一个单步提前预测。但是,这仅会产生一个预测。相反,我们想要生成一个提前一步的预测,向模型中添加一个新的观察值,然后在该新观察值之外生成另一个提前一个预测(重复直到数据用完)。

这是refit()函数有用的地方。它采用现有模型,并将其应用于新数据集。此调整过程涉及对数据(fitted()值)进行一步预测。通过设置reestimate = FALSE,将不会更新模型的估计系数以更好地适应新的“未来”数据。这解决了模型系数问题,其中包含一些有关我们正在测试预测准确性的未来值的信息。