我试图使用:Stata,R和使用Excel手动计算,使用Blinder-Oaxaca分解OLS回归(两倍)来分解性别工资差距。
所有程序都给我类似的结果;但是,我认为结果是错误的。原因是,职业坡度在女性和男性回归之间变化很大,但它解释了总体差异的-0.001%。我一直在使用偏差编码来获得4级因子。并且还尝试将变量简化为仅2级([0]管理器; [1]其他)。 (使用1和2表示值无效)。
我的计算: (β:斜率; X :特定变量的意思)我正在使用对数工资
*βm βf Xm Xf*
Occupation 0.031 0.183 0.14 0.14
Explained occupation: βm(Xm-Xf)
Unexplained occupation: (βm-βf)Xf
显然问题是我将0.031乘以(0.14-0.14),等于0。
所以我的问题是:我是否正确处理因子变量?将均值用于虚拟(或偏差编码)因子变量有什么意义?
然而,如前所述; Stata的Oaxaca包给我与R和Excel相同的结果(手动计算)。我迷路了。