Python statsmodel.api逻辑回归(Logit)

时间:2014-10-23 12:24:24

标签: python statistics statsmodels logistic-regression

所以我试图使用python的statsmodels.api进行预测,对二元结果进行逻辑回归。我按照教程使用Logit。 当我尝试对测试数据集进行预测时,每个记录的输出都是0到1之间的小数。 难道不应该给我零和一个吗?或者我必须使用圆函数或其他东西来转换它们。

请原谅这个问题的禁忌。我在盯着我的旅程。

2 个答案:

答案 0 :(得分:1)

预测值是给定解释变量的概率,更准确地说是观察1的概率。

要获得0,1预测,您需要选择一个阈值,如等于阈值的0.5,并为高于阈值的概率分配1。

使用numpy,这将是例如

predicted = results.predict(x_for_prediction)
predicted_choice = (predicted > threshold).astype(int)

答案 1 :(得分:0)

如果响应是在单位区间被解释为概率,除了损失考虑因素之外,另一个可能有帮助的观点是将其视为二项式结果,而不是伯努利计数。特别是,除了你问题中的概率反应之外,每种情况下的试验数量是否相符?如果存在,则逻辑回归可以重新表达为二项式(计数)响应,其中(整数)计数将是通过概率和试验次数的乘积获得的舍入期望值。