NLTK确定性措施?

时间:2012-02-15 05:16:50

标签: python classification nltk probability

在NLTK中,如果我为一部电影评论写一个NaiveBayes分类器(确定是正面还是负面),在分类特定评论时如何确定分类器“确定性”?也就是说,我知道如何在给定的测试集上运行“准确度”测试,以查看分类器的一般准确性。但是,无论如何让NLTk输出它的证明吗? (也许基于最具信息性的特征......)

由于 甲

2 个答案:

答案 0 :(得分:1)

我不确定朴素贝叶斯的NLTK实现,但朴素贝叶斯算法输出类成员资格的概率。但是,它们的校准非常糟糕。

如果您需要良好的确定性测量,则应使用不同的分类算法。 Logistic回归在生成校准估计值方面做得不错。

答案 1 :(得分:1)

nltk.classify.util.log_likelihood。对于这个问题,您还可以尝试通过精度,召回,令牌级别的F分数来测量结果,即分别为正数和负数。