我有一个数据集,代表一些国际奥林匹克运动会的参与者,它的列有性别(虚拟变量),奥林匹克运动会的年份,一个人的名字和该人获得的奖金。我需要估计以下线性概率模型:1 {gold_ind_i = 1} =α+β×1 {d_female_i = 1} + ∑_(j来自1968年至2018年)μ_j×1 {Y年= i年} +εi
,即我的因变量是表示特定人员是否获得金牌的虚拟变量,预测变量是性别的虚拟变量(如果一个人是女性,则等于1)和每年的虚拟变量。例如,在1999年,该年的虚拟对象等于1,而其他所有年份的虚拟对象均为0。
我可以对可变性别进行回归分析。问题在于,由于我有大量年份(从1960年代到2000年代)的样本,因此将与模型相关的假人包括在年份中
答案 0 :(得分:-1)
找到了解决方案:只需使用“ fastDummies”包即可。