预测班级的预测概率

时间:2019-04-27 12:33:38

标签: pandas machine-learning scikit-learn sklearn-pandas

ml初学者在这里。

我有一个包含GPA,GRE,TOEFL,SOP&LOR排名(满分5分)等的数据集。 (全部为数字),最后一栏说明是否被大学录取(0或1),这将用作y_train。 我不仅要对预测的标签进行分类,还要计算每个人被录取的概率。

edit:因此,从第一个注释中,我建立了一个Logistic回归模型,并且通过一些搜索,我从sklearn找到了'predict_proba'并尝试实现它。没有任何语法错误,但是predict_proba给出的代码值非常错误。

链接:https://github.com/tarunn2799/gre-pred/blob/master/GRE%20Admission%20Probability-%20Extraaedge.ipynb

请帮助我找出问题所在,并提供减少损失的提示

谢谢!

1 个答案:

答案 0 :(得分:0)

我读了您的笔记本,但我感到困惑,为什么您认为predict_proba是错误的。 预测准确性是否不好,或者predict_proba的格式不符合您的预期?

您可以使用sklearn.metrics.accuracy_score()sklearn.metrics.confusion_matrix()检查预测标签,或使用sklearn.metrics.roc_auc_score()检查predict_proba的结果。检查火车和文字两个部分是否更好。

我认为predict_proba的格式是正确的,或者您可以尝试predict_log_proba()来计算对数概率?

希望这可以为您提供帮助。