根据每两年一次的全国调查,我有一个df;时间段是2010-14,我过滤了df,以便只有至少出现两次的人。通过这种方式,我有一个面板df但不平衡。
我进行回归研究哪些变量会影响补充养老金的参与(在我国是自愿的)。我运行单侧固定效应回归,现在我想运行双方固定效应回归(个人和时间)。
单个变量是uid,时间变量是年份。我在r:
中使用了plm包df.p <- plm.data(df, c("uid", "year")
并运行回归:
reg1 <- plm(pens ~ woman + age + I(age^2/100) + high + medium + nord + centre, model="within", effect="twoways", data=df.p)
高中和中等是关于教育水平和北方和中心关于地理位置的假人。为了简洁起见,我省略了原始模型中存在的其他变量(20个变量)。
在工作至少1小时后,我运行摘要命令:
summary(reg1)
经过一个小时的工作后我得到了错误:
Error in crossprod(t(X), beta) : non-conformable arguments
所以我认为存在多重共线性问题。所以我用相关矩阵检查多重共线性:
p1 <- with(df, data.frame(woman=woman, age=age, high=high, medium=medium, nord=nord, centre=centre))
round(cor(p1),3)
考虑一下我使用所有变量创建矩阵(这里为了简洁起见省略了,正如我所写)。我没有找到任何相关的价值。我还检查了方差膨胀系数:
vif(p1)
我得到了:
No variable from the 20 input variables has collinearity problem.
在这一点上,我认为共线性问题可以通过我进行双方回归这一事实来确定,但我不知道如何解决这个问题。
提前致谢