解释混淆矩阵

时间:2018-04-09 01:55:02

标签: python machine-learning scikit-learn classification confusion-matrix

我需要创建一个分类模型来预测某个事件的类别 - 1,2或3.我到目前为止尝试了两个模型:多类决策树&多类神经网络。以下是每个人的准确度得分和混淆矩阵。

多类决策树:

总体准确度0.634 平均准确度为0.756 微观平均精度为0.634 宏观平均精度0.585184 微观平均回忆0.634 宏观平均召回0.548334

混淆矩阵:

  1. 40.3%53.6%6.1%
  2. 6.6%76.6%16.8%
  3. 0.6%51.8%47.6%
  4. 多类神经网络: 总体准确度0.5865 平均准确度0.724333 微观平均精度0.5865 宏观平均精度为0.583795 微观平均召回0.5865 宏观平均召回0.460215

    混淆矩阵:

    1. 34.8%63.5%1.7%
    2. 2.9%89.3%7.7%
    3. 0.1%85.9%13.9%

      我认为这意味着在Class2上,两个模型都做得很好,尤其是神经网络模型。在其他类中,决策树模型做得更好,但仍然低于50%。

    4. 如何根据这些指标改善结果?谢谢。

1 个答案:

答案 0 :(得分:-1)

删除ID功能,同时检查并删除您认为不会对预测(ID等任何其他功能)或具有唯一值的功能添加任何值的任何功能。还要检查是否存在任何类不平衡(数据中每个类的样本数量是多少,各类之间是否存在适当的平衡?)。然后尝试应用模型并调整参数以获得更好的结果。您可以使用交叉验证来获得更好的结果。