Scikit学习MultinomialNaiveBayes错误分类

时间:2019-03-01 11:50:07

标签: scikit-learn feature-extraction naivebayes

我正在尝试构建多项式NaiveBayes分类器。 在为二进制类标签获取前10个功能时,我发现8个功能同时被标记为正和负。这不是重大的错误分类错误吗?

feature_names = mnbayes.count_vect.get_feature_names()

top10_negve = np.argsort(mnbayes_clf.feature_log_prob_[0])[-10:]
print(top10_negve)
print("%s: %s" % (0,
    " ".join(feature_names[j] for j in top10_negve)))

输出
[6384 6189 309 10536 4036 3686 9380 7197 5324 6222]
0:一个没有亚马逊的食物会很好吃,而不是

top10_posve = np.argsort(mnbayes_clf.feature_log_prob_[1])[-10:]
print(top10_posve)
print("%s: %s" % (1,
    " ".join(feature_names[j] for j in top10_posve)))

输出
[6384 7197 5467 10536 3602 9380 4129 4036 5324 6222]

1:一种产品的喜爱会使味道鲜美,而不是

我正在创建一个BOW,然后矢量化文本。
通过我的测试数据,我获得了0.90%的准确性得分。

问题
我应该注意什么或出了什么问题? 在这种情况下,我需要显示代码的哪一部分以获得帮助?

0 个答案:

没有答案