为了预测近期内的事件,我正在使用Logit模型和面板数据。因此大约有1500个不平衡面板,T约为800。现在,我使用最大似然估计来估计logit模型。
主题与工程过程有关,因此模型中协变量之间肯定存在相关性。例如,机器的温度会随时间影响另一个协变量,而不仅仅是二进制因变量。我读到这可能会造成多重共线性问题(协变量之间的依赖性)。有没有一种方法可以解决这个问题而不删除协变量?另外,异方差是否会给预测概率带来问题?我读到,使用Logit模型时这应该不是问题。而且我每秒都有数据,我应该先求差以获取固定数据吗?
我正在估计以下模型:
p_{it} = Logit( \alpha + \phi p_{i,t-1} + \beta X_{i, t-30} + \epsilon_{t})