我正在使用OpenNLP对文档进行分类, 我使用下面的代码:
DocumentCategorizerME categorizer = new DocumentCategorizerME(doccatModel);
double[] outcome = categorizer.categorize(say);
return categorizer.getBestCategory(outcome);
我总是得到总结为1的结果。
问题是即使比赛很差 - 其中一个类别似乎得到了相当不错的分数,因为它只比其他类别好一点。
我尝试了DocumentCategorizerME公开的不同方法,它们都以不同的方式返回相同的结果。
我如何获得好成绩,而不仅仅是概率分布?
由于
答案 0 :(得分:0)
if (Collections.max(Arrays.asList(ArrayUtils.toObject(outcome))) > 0.3) {
System.out.print(categorizer.getBestCategory(outcome));