OpenNLP-使用DocumentCategorizer获得每个类别的真实分数

时间:2017-04-09 14:02:34

标签: java opennlp categorization

我正在使用OpenNLP对文档进行分类, 我使用下面的代码:

DocumentCategorizerME categorizer = new DocumentCategorizerME(doccatModel);
double[] outcome = categorizer.categorize(say);
return categorizer.getBestCategory(outcome);

我总是得到总结为1的结果。

问题是即使比赛很差 - 其中一个类别似乎得到了相当不错的分数,因为它只比其他类别好一点。

我尝试了DocumentCategorizerME公开的不同方法,它们都以不同的方式返回相同的结果。

我如何获得好成绩,而不仅仅是概率分布?

由于

1 个答案:

答案 0 :(得分:0)

if (Collections.max(Arrays.asList(ArrayUtils.toObject(outcome))) > 0.3) {
            System.out.print(categorizer.getBestCategory(outcome));