我正在尝试使用[r]在两个大型数据集上运行plm,一个数据集为400K,另一个数据集为110万。我可以在SAS中运行较小的但是较大的不起作用。我试图看看是否可以使用[r],当我尝试运行下面的代码时,它总是返回如下:
> pvlag<-read.csv(file="pvlag.csv", sep=",")
> pvpanel<-plm.data(pvlag, c("New_ID", "billmo"))
pv<-plm(usetotl~livgarea+yardarea+poolsize+lagavg+lat1+nonlat1+grad+grad,data=pvpanel, model="random", random.method=("swar"), index=c("New_ID", "billmo"))
系列是常量并已被删除错误 solve.default(crossprod(X.m)):系统是计算奇异的: 互惠条件数= 6.47315e-22
这两种数据集都会发生这种情况,即使我在SAS中运行较小的数据集时,也会毫无问题地输出估计的系数等。有谁知道为什么会这样?此外,由于我正在运行随机效果模型,为什么要删除合适的值?我认为这只是固定效果模型的一个问题?
答案 0 :(得分:3)
你使用变量 grad 两次。如果你使用虚拟变量会在整个样本上产生1,也就是说你有两个虚拟变量,第一个在前200K中有1个,第二个在第二个200K上有一个虚拟变量。你不能同时使用两者。你必须选择一个 - 但无论哪个都没关系。
答案 1 :(得分:0)
对我来说,当我收到这个错误时,我陷入了虚拟陷阱。那不是你的情况吗?