如何使用opennlp从文件中仅提取名词短语?

时间:2018-10-04 06:25:30

标签: java opennlp

(TOP(NP(NP(NP john)(NNS作品))(PP(IN in)(NP(NN Kollam)(NN喀拉拉邦))))) 我得到了上面的输出。但是我只想要名词短语。我无法处理该文件。如何实现它。

1 个答案:

答案 0 :(得分:0)

为什么要使用解析器?您为什么不使用Chunker?试试:

$ echo "john works in Kollam Kerala." | opennlp TokenizerME en-token.bin | opennlp POSTagger en-pos.bin | opennlp ChunkerME en-chunker.bin

它显示:

 [NP john_NN works_NNS ] [PP in_IN ] [NP Kollam_NNP Kerala_NNP ] ._.