opennlp.tools.util.Span类中的getType()?

时间:2016-10-10 11:13:25

标签: java nlp opennlp

我正在使用opennlp opennlp.tools.chunker.ChunkerME实现来查找块。在这个课程中,我调用了chunkAsSpans(..)方法,该方法返回Span[]

所以,这个Span实例有getType() getter方法,它返回类似的类型 NP,VP 等。

我想知道什么类型的Span意味着什么?是POS吗?

1 个答案:

答案 0 :(得分:3)

NP代表名词短语,VP代表动词短语。

如果查看Chunker Training帮助页面,您会看到以下内容:

  

训练数据必须转换为OpenNLP chunker训练格式,该格式基于CoNLL2000:训练数据由三个以空格分隔的列组成。每个单词都放在一个单独的行上,每个句子后面都有一个空行。第一列包含当前单词,第二列包含词性标记,第三列包含块标记。块标签包含块类型的名称,例如I- NP用于名词短语词,I- VP用于动词短语词