我使用以下代码创建了滞后因变量:
library(dplyr)
x <- mutate(newdata, lagIncident = lag(Incident))
Incident
是我在数据集中的因变量。
创建包含LDV的数据集后,我正在使用多元回归分析,并且最终预测不正确。在我的数据中,我有storeid
列,对于某些storeid
,有超过2名员工。
因此,例如:对于storeid == 2
,事件发生率为24.63,则所有员工的事件发生率均为24.63。但是,在最终的预测中,我得到的是一个雇员编号的不同值-1 * 29 ***
storeid Emloyee id Incident rate(DV) Incident Lagged DV Predicted Values
2 1*29*** 24.63 34.49 33.04676246
2 1*96*** 24.63 24.63 26.30500284
2 1*51*** 24.63 24.63 25.04769368
2 1*73** 24.63 24.63 24.65631746
2 1*74** 24.63 24.63 24.04543251
2 1*75** 24.63 24.63 26.58273938
2 1*62** 24.63 24.63 24.51183327
2 1*22** 24.63 24.63 24.20547125
2 1*82** 24.63 24.63 24.02392616
2 1*71** 24.63 24.63 23.94362569
2 1*52** 24.63 24.63 23.21912862
2 1*78** 24.63 24.63 24.39341325
2 1*67** 24.63 24.63 24.99674625
我正在使用R ...请让我知道我的代码有什么问题或我做错了什么事情