假设我使用寓言包使用涵盖2019年的每日数据估算以下模型,其中x是外生解释变量。术语pdq(p = 1, d = 0, q = 0)
和PDQ(P = 0, D = 0, Q = 0)
表示这是一个自回归模型。
library(tidyverse)
library(fable)
load(file, "Some data.RData")
fit <- dta_2019 %>%
tsibble() %>%
model(ar = ARIMA(y ~ x + pdq(p = 1, d = 0, q = 0) + PDQ(P = 0, D = 0, Q = 0)))
现在,我需要使用该模型对2020年的每日数据进行预测,但假设数据始于2020年2月。
forecast_2020 <- fit %>%
forecast(new_data = tsibble(dta_2020))
我的理解是,对于y的滞后值,鉴于这是一个自回归模型,因此它是估算数据集中观察到的最后一个值( dta_2019 )。我可以将y的值初始化为其他值吗?我尝试在 dta_2020 中包含一行,在此特定示例中,该行包含1月31日的观测值,但这导致预测从1月31日开始。
答案 0 :(得分:1)
对于ARIMA模型(使用fable::ARIMA()
),您还需要预测2020年1月才能获得2020年2月的关注预测。如果两个月都可以使用外生回归变量,则可以计算预测。需要提供外生回归变量x
的将来值,但是预测时不需要提供y
的将来值。