我正在研究预测商店销售以预测学习的项目。到目前为止,我已成功使用简单的auto.Arima()函数进行预测。但为了使这些预测更加准确,我可以使用协变量。我已经定义了在这篇文章的帮助下,使用xreg运算符影响商店销售的假期,促销等协变量: 如何在R?
中的auto.arima()中设置xreg参数但我的代码失败了:
ARIMAfit< - auto.arima(saledata,xreg = covariates)
并提出错误说:
model.frame.default中的错误(formula = x~xreg,drop.unused.levels = TRUE):变量长度不同(找到' xreg')另外:警告消息:In!is .na(x)& !is.na(rowSums(xreg)):较长的对象长度不是较短对象长度的倍数
以下是指向我的数据集的链接:https://drive.google.com/file/d/0B-KJYBgmb044blZGSWhHNEoxaHM/view?usp=sharing
这是我的代码:
data = read.csv("xdata.csv")[1:96,]
View(data)
saledata <- ts(data[1:96,4],start=1)
View(saledata)
saledata[saledata == 0] <- 1
View(saledata)
covariates = cbind(DayOfWeek=model.matrix(~as.factor(data$DayOfWeek)),
Customers=data$Customers,
Open=data$Open,
Promo=data$Promo,
SchoolHoliday=data$SchoolHoliday)
View(head(covariates))
# Remove intercept
covariates <- covariates[,-1]
View(covariates)
require(forecast)
ARIMAfit <- auto.arima(saledata, xreg=covariates)//HERE IS ERROR LINE
summary(ARIMAfit)
还告诉我如何预测未来48天。我知道如何使用简单的auto.Arima()和n.ahead进行预测,但是在使用xreg时不知道如何进行预测。
答案 0 :(得分:5)
几点。一,您可以将整个矩阵转换为ts对象,然后稍后隔离变量。其次,如果您在arima模型中使用协变量,那么当您预测样本外时,您需要提供它们。这可能意味着在为您感兴趣的变量生成预测之前预测每个协变量。在下面的示例中,为简单起见,我将数据拆分为两个样本。
dta = read.csv("xdata.csv")[1:96,]
dta <- ts(dta, start = 1)
# to illustrate out of sample forecasting with covariates lets split the data
train <- window(dta, end = 90)
test <- window(dta, start = 91)
# fit model
covariates <- c("DayOfWeek", "Customers", "Open", "Promo", "SchoolHoliday")
fit <- auto.arima(train[,"Sales"], xreg = train[, covariates])
# forecast
fcast <- forecast(fit, xreg = test[, covariates])