时间序列分析:创建滞后因变量不能给我正确的预测?

时间:2018-08-01 15:24:05

标签: r time-series linear-regression

我使用以下代码创建了滞后因变量:

library(dplyr)
x <-  mutate(newdata, lagIncident = lag(Incident))

Incident是我在数据集中的因变量。

创建包含LDV的数据集后,我正在使用多元回归分析,并且最终预测不正确。在我的数据中,我有storeid列,对于某些storeid,有超过2名员工。

因此,例如:对于storeid == 2,事件发生率为24.63,则所有员工的事件发生率均为24.63。但是,在最终的预测中,我得到的是一个雇员编号的不同值-1 * 29 ***

storeid Emloyee id  Incident rate(DV)   Incident Lagged DV  Predicted Values
2   1*29*** 24.63   34.49   33.04676246
2   1*96*** 24.63   24.63   26.30500284
2   1*51*** 24.63   24.63   25.04769368
2   1*73**  24.63   24.63   24.65631746
2   1*74**  24.63   24.63   24.04543251
2   1*75**  24.63   24.63   26.58273938
2   1*62**  24.63   24.63   24.51183327
2   1*22**  24.63   24.63   24.20547125
2   1*82**  24.63   24.63   24.02392616
2   1*71**  24.63   24.63   23.94362569
2   1*52**  24.63   24.63   23.21912862
2   1*78**  24.63   24.63   24.39341325
2   1*67**  24.63   24.63   24.99674625

我正在使用R ...请让我知道我的代码有什么问题或我做错了什么事情

0 个答案:

没有答案