OpenNLP如何创建解析器分块的模型

时间:2016-08-04 03:00:28

标签: java parsing opennlp text-chunking

我正在尝试使用OpenNLP在葡萄牙语中创建解析器块。但我没有成功。
我认为创建模型需要两个文件:

  • 一个具有train.all扩展名和格式的培训文件:

    <app-default-route-view (compareEvent)="hideAppChange($event)">
    </app-default-route-view>
    
  • 一个带有headRules名称的规则文件。我的文件包含从互联网上获取的这些规则。

    (TOP (S (NP-SBJ (DT Some) )(VP (VBP say) (NP (NNP November) ))(. .) ))
    (TOP (S (NP-SBJ (PRP I) )(VP (VBP say) (NP (CD 1992) ))(. .) ('' '') ))
    

我使用此命令生成模型en-parser-chunking.bin

20 ADJP 0 NNS QP NN $ ADVP JJ VBN VBG ADJP JJR NP JJS DT FW RBR RBS SBAR RB 
15 ADVP 1 RB RBR RBS FW ADVP TO CD JJR JJ IN NP JJS NN
5 CONJP 1 CC RB IN
2 FRAG 1 
2 INTJ 0 
4 LST 1 LS :
19 NAC 0 NN NNS NNP NNPS NP NAC EX $ CD QP PRP VBG JJ JJS JJR ADJP FW
8 PP 1 IN TO VBG VBN RP FW
2 PRN 1 
3 PRT 1 RP

所以,我使用这个模型en-parser-chunking.bin来处理解析器。遵循代码:

$ Bin / OpenNLP ParserTrainer -encoding ISO-8859-1 -lang en -parserType CHUNKING -headRules head_rules -data train.all -model en-parser-chunking.bin

运行代码时,会发生以下错误:

ParserModel modelParse = new ParserModel(parserStream);
Parser parser = ParserFactory.create(modelParse);
Parse Parses [] = ParserTool.parseLine ("Some say Novembro", parser, 1);

如何创建模型解析器-chunking.bin?

0 个答案:

没有答案