在Logistic回归模型中准确性得分较低的原因可能是什么?

时间:2019-10-15 23:11:02

标签: python-3.x machine-learning project

我正在基于“银行违约”分类构建ML项目,并且准确率低至56%,准确性低至61%。我知道这可以进一步改善。请让我知道一些可能导致分数提高的因素。

有关偿还贷款的数据,我必须将客户分类为违约者或非违约者。我的培训测试率为70%:30%。

'X = loan.drop(“ loan_status”,axis = 1)     Y = loan [“ loan_status”]'  Xtrain,Xtest,Ytrain,Ytest=train_test_split(X,Y,test_size=0.30,random_state=6) loan_model=LogisticRegression() Prediction=loan_model.predict(Xtest) 分类报告:  精确召回f1得分支持

       0       0.41      0.22      0.29        59
       1       0.61      0.79      0.69        91
微型平均0.57 0.57 0.57 150    宏观平均0.51 0.51 0.49 150 加权平均0.53 0.57 0.53 150 混淆矩阵: [[13 46]  [19 72] 准确度得分: 准确性得分是:0.5666666666666667

1 个答案:

答案 0 :(得分:0)

在看不到您的数据或代码的情况下,我们只能为您提供一般建议,以提高您的准确性。 以下是我想到的两个主要问题,

1-分类的准确性较低,这意味着您的课程与当前的功能不能很好地分开。解决办法是找到更多(更好)的功能。

2-如果您有足够的观察,请尝试使用更复杂的决策边界的模型,例如 SVM 或具有深层和神经元的NN。