我试图了解每个功能对特定分类的贡献。假设我有客户,因为我的数据是收入,债务和年龄。我们正在尝试预测它们是否会拖欠某些贷款。客户1已分类,因为它们将以95%的概率违约。我想确定每个功能对此客户的分类结果有多大贡献,其基本目标是显示例如收入主要推动客户1的默认分类,而债务主要推动客户2的默认分类。
逻辑回归定义为
单个客户的分类是
我想了解每个特征(b_i)贡献了多少,但是除非我们去除指数,否则我们无法拆分特征并计算它们在概率中所占的比例。我们可以看看对数赔率的贡献
但是现在右边的术语可以是正数或负数,因此我不能说b_0例如占分类结果的20%。
这似乎是一个简单的问题,但答案尚不清楚。对数赔率在上方。如果我们将-2,-0.4和0.3相加并求解p,我们将得出违约概率。我们知道,最大的数字对该分类有最大的贡献,但是我如何比较0.3对-2和-0.4的贡献呢?