我正在使用opennlp opennlp.tools.chunker.ChunkerME
实现来查找块。在这个课程中,我调用了chunkAsSpans(..)
方法,该方法返回Span[]
。
所以,这个Span
实例有getType()
getter方法,它返回类似的类型
NP,VP 等。
我想知道什么类型的Span意味着什么?是POS吗?
答案 0 :(得分:3)
NP
代表名词短语,VP
代表动词短语。
如果查看Chunker Training帮助页面,您会看到以下内容:
训练数据必须转换为OpenNLP chunker训练格式,该格式基于CoNLL2000:训练数据由三个以空格分隔的列组成。每个单词都放在一个单独的行上,每个句子后面都有一个空行。第一列包含当前单词,第二列包含词性标记,第三列包含块标记。块标签包含块类型的名称,例如I- NP用于名词短语词,I- VP用于动词短语词。