我正在使用R中的glm模型,并且有一些问题要问。
当我找到varImp(model)
时,就会出现以下三个主要功能:
wordcount_1st 6.28298228
soudan3_1st 3.56994132
srhigh 3.29050969
但是赔率比率返回的特征与top3完全不同:
days_sat1st 3.961242e+31
days_tue1st 3.120212e+31
days_sun1st 3.024285e+31
我该如何解释?谢谢。
答案 0 :(得分:0)
我不会将Could not cast value of type '__NSArrayI' (0x108ac6da8) to 'NSDictionary' (0x108ac5818).
用作变量重要性指标。它缺少很多信息。
检查odds.ratio
的源代码,我们可以看到OR只是系数的指数:
questionr::odds.ratio
比较系数的简单变换是不理想的,因为它们可能具有不同的比例,并且没有考虑其方差。而且,系数的指数不会提供有关零假设(即系数等于零)是否成立的任何信息。
cbind(exp(stats::coef(x)), exp(stats::confint(x, level = level)))
函数根据标准化系数(即系数与标准误差之间的分度)计算变量重要性。该方法考虑了系数的方差,使得系数的比较更加合理。