数据集:UCI提供的绞痛数据集
我尝试了各种算法进行分类,最后,最佳精度模型是RandomForest(86%)。 但是,当我查看TP / FP比率时,我认为是的FP比率太高(0.235)。 与其他类型的数据集相比,由于该数据集与医学有关,因此错误判断的成本更高。
如果我想降低我的计划生育率并改善分类,有什么办法(在现有数据下)?
===详细的分类精度===
TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.922 0.235 0.870 0.922 0.895 0.705 0.906 0.924 yes
0.765 0.078 0.852 0.765 0.806 0.705 0.906 0.883 no
Weighted Avg. 0.864 0.177 0.863 0.864 0.862 0.705 0.906 0.909
=== Confusion Matrix ===
a b <-- classified as
214 18 | a = yes
32 104 | b = no