我有一个二进制分类问题:
我尝试使用以下方法为我的模型找到最佳参数
grid = {'penalty': ['l1', 'l2'],'C':[0.001,.009,0.01,.09,1,5,10,25]}
logreg =GridSearchCV(LogisticRegression(),grid,cv=5,scoring = 'recall')
logreg.fit(X, Y)
Y_Pred = logreg.predict(X)
我想知道参数scoring = 'recall'
到底是什么。当我添加它时,它可以大大改善我的模型。
答案 0 :(得分:0)
计分基本上是评估模型的方式。 Scikit支持很多,您可以看到完整的得分手here。
具有较高的召回率意味着您的模型具有较高的真实肯定率和较少的错误否定性。这意味着有更多的实际正值被预测为true,而更少的实际正值被预测为false。您可能还想了解有关confusion matrix的更多信息。
关于应该使用哪种评分方式,取决于您要在模型中实现的目标。