Question

数据集：UCI提供的绞痛数据集

我尝试了各种算法进行分类，最后，最佳精度模型是RandomForest（86％）。但是，当我查看TP / FP比率时，我认为是的FP比率太高（0.235）。与其他类型的数据集相比，由于该数据集与医学有关，因此错误判断的成本更高。

如果我想降低我的计划生育率并改善分类，有什么办法（在现有数据下）？

===详细的分类精度===

                 TP Rate  FP Rate  Precision  Recall   F-Measure  MCC      ROC Area  PRC Area  Class
                 0.922    0.235    0.870      0.922    0.895      0.705    0.906     0.924     yes
                 0.765    0.078    0.852      0.765    0.806      0.705    0.906     0.883     no
Weighted Avg.    0.864    0.177    0.863      0.864    0.862      0.705    0.906     0.909 



=== Confusion Matrix ===

   a   b   <-- classified as
 214  18 |   a = yes
  32 104 |   b = no

如何处理低假阳性率或改善混淆矩阵

0 个答案: