如here所述,在测试集中进行单步预测是一种避免随着预测范围增加而不可避免地增加方差的方法。在该部分中提到的方法是使用已经训练好的模型对forecast
包对测试集执行一步预测。是否有使用更新的fable
包对测试数据执行单步预测的类似方法?也许here, for example中描述的new_data
参数可以解决此问题,但是我不确定,因为h = 24
和new_data = x_test
的预测如下:
> library(fable)
> library(fabletools)
> x <- USAccDeaths %>%
+ as_tsibble()
> x
# A tsibble: 72 x 2 [1M]
index value
<mth> <dbl>
1 1973 Jan 9007
2 1973 Feb 8106
3 1973 Mar 8928
4 1973 Apr 9137
5 1973 May 10017
6 1973 Jun 10826
7 1973 Jul 11317
8 1973 Aug 10744
9 1973 Sep 9713
10 1973 Oct 9938
# … with 62 more rows
> x_train <- x %>% filter(year(index) < 1977)
> x_test <- x %>% filter(year(index) >= 1977)
> fit <- x_train %>% model(arima = ARIMA(log(value) ~ pdq(0, 1, 1) + PDQ(0, 1, 1)))
> fit
# A mable: 1 x 1
arima
<model>
1 <ARIMA(0,1,1)(0,1,1)[12]>
> nrow(x_test)
[1] 24
> forecast(fit, h = 24)$.mean
[1] 7778.052 7268.527 7831.507 7916.845 8769.478 9144.790 10004.816 9326.874 8172.226
[10] 8527.355 8015.100 8378.166 7692.356 7191.343 7751.466 7839.085 8686.833 9062.247
[19] 9918.487 9250.101 8108.202 8463.933 7958.667 8322.497
> forecast(fit, new_data = x_test)$.mean
[1] 7778.052 7268.527 7831.507 7916.845 8769.478 9144.790 10004.816 9326.874 8172.226
[10] 8527.355 8015.100 8378.166 7692.356 7191.343 7751.466 7839.085 8686.833 9062.247
[19] 9918.487 9250.101 8108.202 8463.933 7958.667 8322.497
答案 0 :(得分:1)
model
包中的许多模型可用的{forecast}
自变量等效于refit()
包中的{fable}
方法。当与将来的数据一起使用时,它可以用于根据模型生成多个单步预测。
library(forecast)
fit <- head(USAccDeaths, -24) %>%
auto.arima()
fit_test <- tail(USAccDeaths, 24) %>%
Arima(model = fit)
accuracy(fit_test)
#> ME RMSE MAE MPE MAPE MASE
#> Training set 22.45098 167.0648 85.59724 0.2382773 0.9327587 0.3298545
#> ACF1
#> Training set -0.0968173
library(fable)
library(dplyr)
us_accidental_deaths <- as_tsibble(USAccDeaths)
fit <- head(us_accidental_deaths, -24) %>%
model(ARIMA(value))
fit_test <- refit(fit, tail(us_accidental_deaths, 24), reestimate = FALSE)
accuracy(fit_test)
#> # A tibble: 1 x 10
#> .model .type ME RMSE MAE MPE MAPE MASE RMSSE ACF1
#> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 ARIMA(value) Training 22.5 167. 85.6 0.238 0.933 0.330 0.490 -0.0968
由reprex package(v0.3.0)于2020-10-13创建
模型的fitted()
值是提前一步的预测,可用于评估“训练准确性”性能(训练数据的预测准确性)。但是有一个问题-模型的估计参数是基于整个训练集的,因此训练的准确性比预期的要好(该模型包含有关适合的未来的一些信息)。
forecast()
函数用于生成模型从未见过的未来时间点的预测。您可以使用forecast(<mable>, h = 1)
来生成一个单步提前预测。但是,这仅会产生一个预测。相反,我们想要生成一个提前一步的预测,向模型中添加一个新的观察值,然后在该新观察值之外生成另一个提前一个预测(重复直到数据用完)。
这是refit()
函数有用的地方。它采用现有模型,并将其应用于新数据集。此调整过程涉及对数据(fitted()
值)进行一步预测。通过设置reestimate = FALSE
,将不会更新模型的估计系数以更好地适应新的“未来”数据。这解决了模型系数问题,其中包含一些有关我们正在测试预测准确性的未来值的信息。