我正在使用Python Scikit学习解决一个文档分类问题。 我使用CountVectorizer从文本文档中获取字数。 并使用MultinomialNB分类器进行类预测。 我的模型准确率为94.5%。我仍在努力提高分类准确性。 在那个过程中,我尝试打印混淆矩阵,它看起来如下所示。 显然有32个误报(对角线上方所有元素的总和 - 11 + 2 + 3 + 4 + 1 + 1 + 10 = 32)。 我在这里被封锁了。我可以从这里继续进一步提高分类准确度吗? 如果是,请指导我完成这些步骤。
| 1 2 3 4 5 6 7 8 |
--+---------------------------------+
1 |<561> 11 . . . 2 . . |
2 | 7<313> 3 . . . . . |
3 | . . <41> . . . . 4 |
4 | . 1 . <15> . 1 . . |
5 | . . 1 . <4> . . . |
6 | . . . . . <45> . 1 |
7 | . . 1 . . . <36> 10 |
8 | . . 1 . . . 3 <36>|
--+---------------------------------+
Thanks!