我的数据集中有300家商店和2万种产品,我想针对每种产品级别的每个网点预测未来3个月的销售预测。我的数据框看起来像这个(样本),就像我从SQL Server 2016中获取的数据框一样
Date outlet produ price
2019-Jan A W 10
2019-Feb A R 20
2019-Feb A W 15
2019-Jan B W 30
2019-Jan B F 40
2019-Feb B W 40
我尝试的是获取整个时间序列中的单个产品观测值,并设置为模型并获取输出
##getthe data set like this
outlet <-c('A','A','B','B')
produ <-c('W','R','W','F')
price <-c(10,20,30,40)
df <- data.frame(outlet,produ,price)
##tried to get single product
dpSingle <- dplyr::filter(df,df$produ == 'W')
data.ts=ts(Quntity, start=c(year,month), frequency=12)
fit_arima <- auto.arima(data.ts,d=1,D=1,stepwise = FALSE
,approximation = FALSE, trace = TRUE)
fcast<-forecast(fit_arima,h=24)
autoplot(fcast) + ggtitle("Forecasted for next 24 months")+
ylab("quntity")+xlab("Time in days")
print((exp(fcast$mean )))
但是我想要的是遍历一个数据框,首先确定出口,然后确定产品,并获得具有特征的细节观测值,并将其传递给我的时间序列模型,并分别获得每个产品每个出口的预测。