我在stanbol中配置了一个包含tika,语言检测,自定义实体识别器和OpenNLP句子检测器的环境链。
我显然已经获得了NER和lang-detect输出,但是setence检测引擎看起来很有效。
我在这里错过了什么吗?
答案 0 :(得分:0)
您应该使用opennlp-token而不是使用opennlp-sentence。句子检测是无用的,因为用于训练模型的模型仅被标记化(并且当然用实体标记)。在输出中,您将永远不会看到输入如何被标记化(或分段为句子),但它将向您显示其推断输出数据的上下文。