我正在使用逻辑回归研究客户流失预测数据集。该模型预测95%的准确性,但混淆矩阵给出以下输出:
array([[1517, 0],
[ 70, 0]], dtype=int64)
我该如何建立模型以预测真实的负面结果?
答案 0 :(得分:1)
这是数据不平衡的典型问题。
您的后勤分类仅是预测一个类(在本例中为0类),根本不考虑任何其他结果。
有很多关键字/想法可以解决此问题,这不在此范围之内。给您一些流行语:
对于这种问题,没有基本的解决方案,您确实需要处理该主题!