R glm varImp无法确定其优势比

时间:2019-02-08 10:03:07

标签: r statistics glm

我正在使用R中的glm模型,并且有一些问题要问。

当我找到varImp(model)时,就会出现以下三个主要功能:

wordcount_1st      6.28298228      
soudan3_1st        3.56994132        
srhigh             3.29050969             

但是赔率比率返回的特征与top3完全不同:

days_sat1st   3.961242e+31
days_tue1st   3.120212e+31
days_sun1st   3.024285e+31

我该如何解释?谢谢。

1 个答案:

答案 0 :(得分:0)

我不会将Could not cast value of type '__NSArrayI' (0x108ac6da8) to 'NSDictionary' (0x108ac5818).用作变量重要性指标。它缺少很多信息。

检查odds.ratio的源代码,我们可以看到OR只是系数的指数:

questionr::odds.ratio

比较系数的简单变换是不理想的,因为它们可能具有不同的比例,并且没有考虑其方差。而且,系数的指数不会提供有关零假设(即系数等于零)是否成立的任何信息。

cbind(exp(stats::coef(x)), exp(stats::confint(x, level = level))) 函数根据标准化系数(即系数与标准误差之间的分度)计算变量重要性。该方法考虑了系数的方差,使得​​系数的比较更加合理。