我有一个30m观测值的数据集。有5个变量:id,id_firm,年龄,年份,薪水。我想对R
进行线性回归,以薪水为因变量,所有其他4个变量为自变量(作为因子)。在回归中有很多固定的影响(或因素)(id〜1m,id_firm〜200k,年龄〜40,年份〜30)。我正在使用的计算机只有8G RAM
(与此无关)。现在,当我使用以下命令运行此回归时:
est <- felm(salary ~ 1 | factor(id) + factor(id_firm) + factor(age) + factor(year),
data = data)
我得到错误提示:
Cannot allocate vector in R of size xx Gb
关于如何运行此回归的任何想法?我认为我正在寻找lfe
命令(吸收固定效果)和biglm
命令(以块形式运行回归)的组合。有什么建议吗?