我正在基于“银行违约”分类构建ML项目,并且准确率低至56%,准确性低至61%。我知道这可以进一步改善。请让我知道一些可能导致分数提高的因素。
有关偿还贷款的数据,我必须将客户分类为违约者或非违约者。我的培训测试率为70%:30%。
'X = loan.drop(“ loan_status”,axis = 1)
Y = loan [“ loan_status”]'
Xtrain,Xtest,Ytrain,Ytest=train_test_split(X,Y,test_size=0.30,random_state=6)
loan_model=LogisticRegression()
Prediction=loan_model.predict(Xtest)
分类报告:
精确召回f1得分支持
0 0.41 0.22 0.29 59
1 0.61 0.79 0.69 91
微型平均0.57 0.57 0.57 150
宏观平均0.51 0.51 0.49 150
加权平均0.53 0.57 0.53 150
混淆矩阵:
[[13 46]
[19 72]
准确度得分:
准确性得分是:0.5666666666666667
答案 0 :(得分:0)
在看不到您的数据或代码的情况下,我们只能为您提供一般建议,以提高您的准确性。 以下是我想到的两个主要问题,
1-分类的准确性较低,这意味着您的课程与当前的功能不能很好地分开。解决办法是找到更多(更好)的功能。
2-如果您有足够的观察,请尝试使用更复杂的决策边界的模型,例如 SVM 或具有深层和神经元的NN。