理解逻辑回归的结果

时间:2017-09-08 18:19:20

标签: excel regression logistic-regression

让我们假设我们有二元响应输出(优惠券)的跟随数据

enter image description here

年度支出是以1000个单位给出的,我的目标是估计如果客户花费超过2000并拥有席梦思卡,还会有优惠券,首先我根据响应数据对数据进行了排序,我得到了以下图片< / p>

enter image description here

在下一阶段,我计算了每个数据的logit,对于那些最初我选择以下系数

B0  0.1
B1  0.1
B2  0.1

我根据以下公式计算了L

enter image description here

在下一阶段我已经计算了e ^ L(excel可以通过exp函数轻松完成)

=EXP(D2)

之后我计算了概率

=E2/(1+E2)

enter image description here

最后使用公式 enter image description here

我已经计算了对数似然函数

然后我计算了总和并使用求解器我已计算出最小化此总和的系数(请注意值以负值给出),但我得到所有系数为零

enter image description here

我错了吗?或者这是否意味着我可以根据年度消费和拥有席梦思卡预测购买优惠券?提前谢谢

1 个答案:

答案 0 :(得分:1)

您可以根据年度支出预测购买优惠券(并且知道席梦思卡不会有帮助)。

不可否认,我没有在Excel中解决它,但我怀疑问题可能是你的优化没有收敛(即,通过求解过程未能达到正确的系数) - 正确的系数是B0 = 5.63,B1 = -2.95,B2 = 0.我在http://blog.excelmasterseries.com/2014/06/logistic-regression-performed-in-excel.html找到了Excel逻辑回归程序的在线参考。

我自己进行了逻辑回归,发现年度支出很大(在0.05水平)而西蒙斯卡则没有。使用Simmons卡重新运行模型会产生以下等式:

    L = 5.63 - 2.95 * Annual spending
    P(1)  =  exp(L)/(1 + exp(L))
    If P(1) > 0.5 => coupon = 1

虽然熵Rsquare低至0.39(并且数据点的数量非常低),但该模型具有统计显着性。