Antlr错误的规则调用

时间:2013-09-05 14:27:35

标签: parsing antlr antlr4 parser-generator

我正在尝试实现解析lucene查询的语法。到目前为止,一切顺利,直到我尝试添加对范围查询的支持。 Lucene详细说明我的语法看起来像这样:

grammar ModifiedParser;

TERM_RANGE : '[' ('*' | TERM_TEXT) 'TO' ('*' | TERM_TEXT) ']'
           | '{' ('*' | TERM_TEXT) 'TO' ('*' | TERM_TEXT) '}'
           ;

query : not (booleanOperator? not)* ;

booleanOperator : andClause
                | orClause
                ;

andClause : 'AND' ;
notClause : 'NOT' ;
orClause  : 'OR' ;

not : notClause? MODIFIER? clause;

clause : unqualified                        
       | qualified                          
       ;

unqualified : TERM_RANGE                   # termRange
            | TERM_PHRASE                  # termPhrase
            | TERM_PHRASE_ANYTHING         # termTruncatedPhrase
            | '(' query ')'                # queryUnqualified
            | TERM_TEXT_TRUNCATED          # termTruncatedText
            | TERM_NORMAL                  # termText
            ;

qualified : TERM_NORMAL ':' unqualified                  
          ;

fragment TERM_CHAR  : (~(' ' | '\t' | '\n' | '\r' | '\u3000'
                    | '\'' | '\"' | '(' | ')' | '[' | ']' | '{' | '}'
                    | '+' | '-' | '!' | ':' | '~' | '^'
                    | '?' | '*' | '\\' ))
                    ;

fragment TERM_START_CHAR : TERM_CHAR
                         | ESCAPE
                         ;

fragment ESCAPE : '\\' ~[];

MODIFIER : '-'
         | '+'
         ;

AND : 'AND';
OR : 'OR';
NOT : 'NOT';

TERM_PHRASE_ANYTHING : '"'  (ESCAPE|~('\"'|'\\'))+  '"' ;
TERM_PHRASE          : '"' (ESCAPE|~('\"'|'\\'|'?'|'*'))+ '"' ;
TERM_TEXT_TRUNCATED : ('*'|'?')(TERM_CHAR+ ('*'|'?'))+ TERM_CHAR*
                    | TERM_START_CHAR (TERM_CHAR* ('?'|'*'))+ TERM_CHAR+
                    | ('?'|'*') TERM_CHAR+
                    ;  

TERM_NORMAL : TERM_TEXT;                                            

fragment TERM_TEXT : TERM_START_CHAR TERM_CHAR* ;

WS : [ \t\r\n] -> skip ;

当我尝试访问并使用令牌时,显然解析asd [ 10 TO 100 ] { 1 TO 1000 } 100..1000会导致[]}和{{1}的令牌识别错误},并且只尝试访问第三个范围的{规则。你们知道我在这里失踪了吗?提前致谢

1 个答案:

答案 0 :(得分:1)

由于您将TERM_RANGE作为词法分析器规则,因此您必须考虑角色级别的所有内容。特别是,您忘记在输入中允许使用空格字符。

如果您改为创建termRange解析器规则,那么您可能处于更好的位置。