使用二元依赖变量的R上的Glm模型:结果&数据

时间:2017-08-01 09:27:32

标签: r binary-data glm

我在R中运行不同的glm模型,带有二元因变量和二元和连续的自变量,但是我用二元自变量获得了奇怪的结果。

这是我正在运行的代码之一,例如:

fit0 <- glm(mention~ media + position,
            data=data,family="binomial",(link=logit))

1)首先,在使用stargazer的结果输出中,我没有得到所有变量级别,所以例如我会得到:

==============================================
                      Dependent variable:     
                  ----------------------------
                            mention           
                       (1)            (2)     
----------------------------------------------
media2                -0.216         0.000    
                     (0.245)     (17,670.150) 
position              5.147          0.000    
                    (191.373)      (893.444)  
insider_outsider0                   53.132    
                                 (56,734.750) 
insider_outsider1                   53.132    
                                 (30,395.090) 
Constant            -2.831***       -26.566   
                     (0.188)     (14,723.680) 
----------------------------------------------
Observations          1,745          1,745    
Log Likelihood       -286.752       -0.000    
Akaike Inf. Crit.    579.504        10.000    
==============================================
Note:              *p<0.1; **p<0.05; ***p<0.01

所以我将获得insider_outsider的可变级别(参考级别除外),但不是媒体,例如,我只获得一个级别,这是一个具有两个级别(1和2)的因子变量。

2)我得到了不同变量的相同结果。例如,检查insider_outsider0和1,它们具有相同的结果。如果我使用其他变量,我得到相同的结果(53.123),例如chec下面的“gt_ngo”和“gt_economic”:

==============================================
                      Dependent variable:     
                  ----------------------------
                            mention           
                       (1)            (2)     
----------------------------------------------
media2                -0.216       -0.00000   
                     (0.245)     (17,757.100) 
position              5.147         0.00000   
                    (191.373)      (987.502)  
gt_ngo0                             53.132    
                                 (30,700.250) 
gt_ngo1                             53.132    
                                 (43,071.060) 
Constant            -2.831***       -26.566   
                     (0.188)     (14,765.750) 
----------------------------------------------
Observations          1,745          1,745    
Log Likelihood       -286.752       -0.000    
Akaike Inf. Crit.    579.504        10.000    
==============================================
Note:              *p<0.1; **p<0.05; ***p<0.01
  • 这可能是因为它们基本上具有相同数量的级别0,1,2并且级别2对于所有这些变量总是出现相同的次数,尽管级别1和0看起来没有相同的数量这些中的每一次?如果是这样,这是一个问题吗?我应该重新安排我的数据吗?

谢谢!

0 个答案:

没有答案