Stata:具有超过11,000个虚拟变量的线性回归

时间:2013-05-11 18:11:22

标签: regression stata dummy-data

我正在尝试使用超过11,000个虚拟交互术语运行面板回归。我的回归看起来像这样:

xi: reg Y i.county*i.year

其中i.county*i.year表示虚拟变量的交互。 Stata,Matlab和R都不会持有这么多变量。我不确定是否有一个命令来增加我所缺少的存储变量的数量(例如stata中的-set matsize-命令)。

我知道Stata矩阵的最大容量是11,000个变量。如何在Stata中运行此固定效果回归?马塔是一个选择吗?

2 个答案:

答案 0 :(得分:2)

如果您没有其他回归者,那么Richard Herron建议在评论中使用collapse可能是最好的方法。如果您确实有其他回归量,那么您的模型只是一个固定效应模型,其中您的灌浆变量只是国家年份。您可以通过键入

来估算您的模型
egen id = group(country year)
xtset id
xtreg y x1 x2, fe

或者:

egen id = group(country year)
areg y x1 x2, absorb(id)

areg的帮助文件中讨论了这两者之间的区别。相关部分是“areg是为具有多个组的数据集而设计的,但不是随着样本大小而增加的数组。请参阅xtreg, fe命令以获取处理数字的情况的估算器组的数量随着样本量的增加而增加。“

答案 1 :(得分:0)

为什么你不能在这里使用随机效果模型? Stata / SE允许您增加变量的最大数量(设置maxvar)但是,具有11,000个固定效果和交互项的回归模型可能会使您的计算机失去顶峰......