多项式朴素贝叶斯中的Python混淆矩阵分析 - Scikit Learn

时间:2017-02-19 03:37:50

标签: python-3.x scikit-learn text-classification naivebayes confusion-matrix

我正在使用Python Scikit学习解决一个文档分类问题。 我使用CountVectorizer从文本文档中获取字数。 并使用MultinomialNB分类器进行类预测。 我的模型准确率为94.5%。我仍在努力提高分类准确性。 在那个过程中,我尝试打印混淆矩阵,它看起来如下所示。 显然有32个误报(对角线上方所有元素的总和 - 11 + 2 + 3 + 4 + 1 + 1 + 10 = 32)。 我在这里被封锁了。我可以从这里继续进一步提高分类准确度吗? 如果是,请指导我完成这些步骤。

      |   1   2   3   4   5   6   7   8 |
    --+---------------------------------+
    1 |<561> 11   .   .   .   2   .   . |
    2 |   7<313>  3   .   .   .   .   . |
    3 |   .   . <41>  .   .   .   .   4 |
    4 |   .   1   . <15>  .   1   .   . |
    5 |   .   .   1   .  <4>  .   .   . |
    6 |   .   .   .   .   . <45>  .   1 |
    7 |   .   .   1   .   .   . <36> 10 |
    8 |   .   .   1   .   .   .   3 <36>|
    --+---------------------------------+


        Thanks!

0 个答案:

没有答案