Question

我正在使用Python Scikit学习解决一个文档分类问题。我使用CountVectorizer从文本文档中获取字数。并使用MultinomialNB分类器进行类预测。我的模型准确率为94.5％。我仍在努力提高分类准确性。在那个过程中，我尝试打印混淆矩阵，它看起来如下所示。显然有32个误报（对角线上方所有元素的总和 - 11 + 2 + 3 + 4 + 1 + 1 + 10 = 32）。我在这里被封锁了。我可以从这里继续进一步提高分类准确度吗？如果是，请指导我完成这些步骤。

      |   1   2   3   4   5   6   7   8 |
    --+---------------------------------+
    1 |<561> 11   .   .   .   2   .   . |
    2 |   7<313>  3   .   .   .   .   . |
    3 |   .   . <41>  .   .   .   .   4 |
    4 |   .   1   . <15>  .   1   .   . |
    5 |   .   .   1   .  <4>  .   .   . |
    6 |   .   .   .   .   . <45>  .   1 |
    7 |   .   .   1   .   .   . <36> 10 |
    8 |   .   .   1   .   .   .   3 <36>|
    --+---------------------------------+


        Thanks!

多项式朴素贝叶斯中的Python混淆矩阵分析 - Scikit Learn

0 个答案: