如何使用statsmodels mnlogit模型指定预测?

时间:2017-05-26 10:17:52

标签: python pandas prediction statsmodels

我正在运行mnlogit回归,我想做一些预测。 我的数据位于pandas DataFrame命名状态,包含age和final_state(以及其他)两列。

import statsmodels.formula.api as smf
result = smf.mnlogit(
    formula = 'final_state ~ age ',
    data = state[['age', 'final_state']],
    ).fit()

params = result.params
print result.summary()

我可以通过运行来预测用于估算的样本:

prediction = result.predict()

但是,如果我想使用子样本或任何其他数据,如下所示:

prediction = result.predict(exog = state[['age']].query('age > 80'))
prediction = result.predict(exog = dict(age = [80, 90]))
prediction = result.predict(
    exog = dict(age = state[['age']].query('age > 80').values))
prediction = result.predict(exog = state[['age']])

我总是遇到同样的错误:

File "/usr/lib/python2.7/dist-packages/statsmodels/base/model.py", line 772, in predict
exog = dmatrix(self.model.data.design_info.builder,
AttributeError: 'PandasData' object has no attribute 'design_info'

如何计算子样本或人工数据的预测?

jeffrey_the_wind在第一条评论中给出了answer,谢谢。

1 个答案:

答案 0 :(得分:2)

I've just submitted this as a bug。事实证明,mnlogit

中的公式行为没有单元测试

不转换数据(而是手动添加常量)是一种解决方法:

from statsmodels.tools import add_constant
result.predict(add_constant(state['age']), transform=False)