我正在如下运行MNLogit(多项式逻辑回归):
from statsmodels.formula.api import MNLogit
model=MNLogit.from_formula("y ~ x", df).fit()
model.summary()
变量y是分类的,并且似乎由MNLogit函数自动伪编码。摘要输出为y的每个类别(参考类别除外)提供一行。
1)如何获得参考类别的标识? (由于y的类别很多,因此手动进行计算很麻烦)
2)因为没有z或P> | z | (p-value)给参考类别,我如何评估参考类别的重要性?
3)如何更改将哪个类别视为参考类别?
答案 0 :(得分:0)
答案 1 :(得分:0)
我相信使用Statmodels MNLogit可以对字符串中的第一个变量进行排序,该列表列出了可能一直用作引用对象的y变量。您可以在示例中使用model.model._ynames_map
来检查第一个变量。这将返回一个字典,并且带有0
键的值应该是用于引用对象的字典。
This site提供了一些有关如何解释引用对象的信息。我不会通过重新输入来掩饰这一点。它不是在python中,而是统计信息的租户可以跨语言使用。
作为第一个排序的响应充当对象,我相信您必须通过添加“ AAAAA”或类似的响应来将响应更改为所需的内容,以确保它在列表中排在首位,但是一旦您能够知道所指对象是谁,并根据需要调整结论的措辞,就没有必要了。