在NLTK中,如果我为一部电影评论写一个NaiveBayes分类器(确定是正面还是负面),在分类特定评论时如何确定分类器“确定性”?也就是说,我知道如何在给定的测试集上运行“准确度”测试,以查看分类器的一般准确性。但是,无论如何让NLTk输出它的证明吗? (也许基于最具信息性的特征......)
由于 甲
答案 0 :(得分:1)
我不确定朴素贝叶斯的NLTK实现,但朴素贝叶斯算法输出类成员资格的概率。但是,它们的校准非常糟糕。
如果您需要良好的确定性测量,则应使用不同的分类算法。 Logistic回归在生成校准估计值方面做得不错。
答案 1 :(得分:1)
nltk.classify.util.log_likelihood
。对于这个问题,您还可以尝试通过精度,召回,令牌级别的F分数来测量结果,即分别为正数和负数。