使用Python 3的Antlr4不接受重音词

时间:2015-11-22 19:00:15

标签: java python nlp antlr nltk

我正在尝试将Antlr4与Python3一起使用,但Antlr不接受带有重音的字母或其他类似!的字母。

我正在使用以下语法:

grammar GramaticaSintagmatica;
tokens {ART,ADJ,SUBS,VERB,PREP,PRON,CONJ,ADV,NUM,FABRICANTE}
WS : ( ’ ’ | ’\t’ | ’\r’ | ’\n’) {skip();} ;
fragment
LetrasAcentuadas :’á’|’à’|’â’|’ã’|’é’|’ê’|’í’|’ó’|’ô’|’õ’|’ú’|’ü’|’ç’|’À’|’Á’|’Â’|’Ã’|’É’|’Ê’|’Í'|’Ó’|’Ô’|’Õ’|’Ú’|’Ü’|’Ç’|’-’;
PALAVRA : (’a’..’z’|’A’..’Z’|LetrasAcentuadas)+ ;
INTS : ’0’..’9’+ (’.’ ’0’..’9’+)? ;
TERMINAL : ’.’|’?’|’!’|’;’;
VIRGULA : ’,’;
MODELO: ((’a’..’z’|’A’..’Z’) ’0’..’9’)+;
NAO : ’não’;
periodo :(oracao | . )*?;
oracao : sn_suj? nao_opc? sv sp_opc?| sp VIRGULA sn_suj? nao_opc? sv sp_opc?;
nao_opc: NAO;
sn_opc : sn;
sn : SUBS| det sa_opc? SUBS mod?;
sn_suj : ( SUBS (PREP? SUBS)* | PRON )| det sa_opc? SUBS (PREP? SUBS)* mod?;
det : pre_det? det_base pos_det?;
pre_det:;
det_base: ART| PRON| NUM;
pos_det: NUM| PRON;
mod : sa?| sp;
sp_opc : sp;
sp : PREP sn| ADV sp_opc?;
sa_opc : sa?;
sa : intens? ADJ ((CONJ | VIRGULA)? ADJ)* sp_opc?;
intens : ADV;
sv : VERB complemento;
complemento : sa_opc? sn_opc? sp_opc?;

有这样的错误:

  

错误< 50>:GramaticaSintagmatica.g4:9:76:语法错误:'?'对我来说完全是一个惊喜   错误< 50>:GramaticaSintagmatica.g4:9:84:语法错误:' - '对我来说完全是一个惊喜   错误< 50>:GramaticaSintagmatica.g4:10:18:语法错误:'..'在寻找lexer规则元素时让我感到非常惊讶   错误< 50>:GramaticaSintagmatica.g4:12:30:语法错误:'!'对我来说完全是一个惊喜

我用这种方式调用antlr-4.5.1-complete.jar:

  

java -jar antlr-4.5.1-complete.jar GramaticaSintagmatica.g4 -o build_python -Dlanguage = Python3

0 个答案:

没有答案