似然比检验和伪Rsquared显着不同(逻辑回归)

时间:2019-12-06 18:59:25

标签: python logistic-regression p-value log-likelihood

我应用了logistic regression,我想测试整体模型的统计显着性。

现在,伪Rsquared (McFaddon)Rsquared = 1 - L(c)/L(null)返回模型解释的方差-其中L(c)表示拟合模型中的最大似然值,{{ 1}}表示空模型的相应值(没有协变量,只有截距)。

可能性检验统计量L(null),遵循LR = 2 * (L(c) - L(null))分布,可以根据模型的自由度对其进行显着性检验。

无论如何,我使用Chi-squared来计算高度有效的Chi-squared但是 p-valuepseudo Rsquared附近?

为什么Rsquared和总体p值相差如此大?

使用一些测试数据0.021的准确性计算,我发现测试数据的准确性仅约为55%(对于训练数据,其准确性约为60%)。

有人可以帮助我解释我的结果吗?

1 个答案:

答案 0 :(得分:1)

也许存在很大的相关性,但是影响仍然很小:由于您正在进行分类,因此您可以检查具有此变量(在二进制情况下为= 1)的示例是否具有较高/较低的概率。属于第1类的成员,而不是没有该变量的成员(在二进制情况下为= 0):

变量为1的示例有50%的可能性属于1类,而变量为0的示例有48%的机会属于1类。

如果存在许多具有该变量的示例,则效果可能仍然很明显(p值),但仅靠其很难预测正确的类(解释方差-r平方)。

这可能是参考,可以帮助您以图形方式了解另一个问题:https://blog.minitab.com/blog/adventures-in-statistics-2/how-to-interpret-a-regression-model-with-low-r-squared-and-low-p-values

相关问题