我正在运行mnlogit
回归,我想做一些预测。
我的数据位于pandas DataFrame
命名状态,包含age和final_state(以及其他)两列。
import statsmodels.formula.api as smf
result = smf.mnlogit(
formula = 'final_state ~ age ',
data = state[['age', 'final_state']],
).fit()
params = result.params
print result.summary()
我可以通过运行来预测用于估算的样本:
prediction = result.predict()
但是,如果我想使用子样本或任何其他数据,如下所示:
prediction = result.predict(exog = state[['age']].query('age > 80'))
prediction = result.predict(exog = dict(age = [80, 90]))
prediction = result.predict(
exog = dict(age = state[['age']].query('age > 80').values))
prediction = result.predict(exog = state[['age']])
我总是遇到同样的错误:
File "/usr/lib/python2.7/dist-packages/statsmodels/base/model.py", line 772, in predict
exog = dmatrix(self.model.data.design_info.builder,
AttributeError: 'PandasData' object has no attribute 'design_info'
如何计算子样本或人工数据的预测?
jeffrey_the_wind在第一条评论中给出了answer,谢谢。
答案 0 :(得分:2)
I've just submitted this as a bug。事实证明,mnlogit
不转换数据(而是手动添加常量)是一种解决方法:
from statsmodels.tools import add_constant
result.predict(add_constant(state['age']), transform=False)