我正在尝试构建多项式NaiveBayes分类器。 在为二进制类标签获取前10个功能时,我发现8个功能同时被标记为正和负。这不是重大的错误分类错误吗?
feature_names = mnbayes.count_vect.get_feature_names()
top10_negve = np.argsort(mnbayes_clf.feature_log_prob_[0])[-10:]
print(top10_negve)
print("%s: %s" % (0,
" ".join(feature_names[j] for j in top10_negve)))
输出
[6384 6189 309 10536 4036 3686 9380 7197 5324 6222]
0:一个没有亚马逊的食物会很好吃,而不是
top10_posve = np.argsort(mnbayes_clf.feature_log_prob_[1])[-10:]
print(top10_posve)
print("%s: %s" % (1,
" ".join(feature_names[j] for j in top10_posve)))
输出
[6384 7197 5467 10536 3602 9380 4129 4036 5324 6222]
1:一种产品的喜爱会使味道鲜美,而不是
我正在创建一个BOW,然后矢量化文本。
通过我的测试数据,我获得了0.90%的准确性得分。
问题
我应该注意什么或出了什么问题?
在这种情况下,我需要显示代码的哪一部分以获得帮助?