我想使用固定效果的泊松回归模型来检查是否选择2种不同的方案(在我的模型中指定为虚拟模型)是否可以增加运动量。
我有3年时间跨度的纵向数据(按月测量), N = 100,000 + (每个ID跟踪的观察值/月数都有所不同) )。 ID可以随时选择采用两种不同的方案,它们可以仅采用一种(方案1),也可以不采用两种方案,或者同时或在不同的时间点(方案1和方案2)进行选择。
我想包括单个固定效果(在选择两种不同方案时使用个体内差异)。
我还想包括月/年固定效应,以控制运动模式中的时间趋势/季节性。我正在考虑为此在给定年份的每个特定月份使用一组虚拟变量。
我想指定我的模型如下:
y(i,my)=Λ(i)+γ(my)+βScheme1(i,my)+βScheme2(i,my)+ε(i,my)
所以 y(i,my)是指ID i在y年的m个月进行的运动的因变量水平。
Λ(i)是个人特定的固定效果。
γ(my)是时间固定效应。
如果 ENT i在第m个月及其之后加入了方案,则方案1和方案2分别取值为1。
仅供参考:非常抱歉,我不得不在上式中用括号将每个变量的定义放在上面
下面是我最初使用glm()
函数运行的内容,仅将方案1和2作为因变量,并且运行良好。
PoissonModel <- glm(DepVar ~ Scheme1 + Scheme2, family = poisson, data = dataset)
我的问题是我不确定如何编写代码/做什么以将Λ(i)和γ(my)也包括在内。任何帮助将不胜感激,谢谢!