应用错误收集

时间：2012-02-15 05:16:50

标签： python classification nltk probability

在NLTK中，如果我为一部电影评论写一个NaiveBayes分类器（确定是正面还是负面），在分类特定评论时如何确定分类器“确定性”？也就是说，我知道如何在给定的测试集上运行“准确度”测试，以查看分类器的一般准确性。但是，无论如何让NLTk输出它的证明吗？（也许基于最具信息性的特征......）

由于甲

答案 0 :(得分：1)

我不确定朴素贝叶斯的NLTK实现，但朴素贝叶斯算法输出类成员资格的概率。但是，它们的校准非常糟糕。

如果您需要良好的确定性测量，则应使用不同的分类算法。 Logistic回归在生成校准估计值方面做得不错。

答案 1 :(得分：1)

nltk.classify.util.log_likelihood。对于这个问题，您还可以尝试通过精度，召回，令牌级别的F分数来测量结果，即分别为正数和负数。