用于布尔/条件表达式的ANTLR v3语法

时间:2013-08-15 20:43:57

标签: grammar antlr3

我正在第一次尝试为表达式创建语法:

(foo = bar or (bar = "bar" and baz = 45.43)) and test = true

到目前为止我的语法看起来像:

grammar filter;

tokens {
    TRUE = 'true';
    FALSE = 'false';
    AND = 'and';
    OR = 'or';
    LT = '<';
    GT = '>';
    EQ = '=';
    NEQ = '!=';
    PATHSEP = '/';
    LBRACK = '[';
    RBRACK = ']';
    LPAREN = '(';
    RPAREN = ')';
}

expression : or_expression EOF;

or_expression : and_expression (OR or_expression)*;

and_expression : term (AND term)*;

term : atom ( operator atom)? | LPAREN expression RPAREN;

atom : ID | INT | FLOAT | STRING | TRUE | FALSE;

operator : LT | GT | EQ | NEQ;

INT : '0'..'9'+;
FLOAT : ('0'..'9')+ '.' ('0'..'9')*;
STRING : '"' ('a'..'z'|'A'..'Z'|'_'|' ')* '"';
ID : ('a'..'z'|'A'..'Z'|'_') ('a'..'z'|'A'..'Z'|'0'..'9'|'_')*;

但是在ANTLRWorks 1.4.3中,我得到了解析树:

The resulting parse tree with the above input

但是对于我的生活,我无法弄清楚我的语法有什么问题。这里缺少什么标记?

非常感谢提前。

编辑:为了澄清atom ( operator atom)?制作中的atom替代方案,我或许应该提到原子应该能够独立而不与另一个原子相比。例如。 a or b是一个有效的表达式。

1 个答案:

答案 0 :(得分:4)

我在这里回答我自己的问题。我发现我的语法有两个问题。第一个很容易发现;我已将EOF放在我的顶级规则的末尾:

expression : or_expression EOF;

EOF因此是遗失的令牌。我的解决方案是从EOF规则中移除expression,然后在其上面引入规则:

filter: expression EOF;

第二个问题是我的or_expression规则应该是:

or_expression : and_expression (OR and_expression)*;

而不是

or_expression : and_expression (OR or_expression)*;

完整更正的语法是:

grammar filter;

tokens {
    TRUE = 'true';
    FALSE = 'false';
    AND = 'and';
    OR = 'or';
    LT = '<';
    GT = '>';
    EQ = '=';
    NEQ = '!=';
    PATHSEP = '/';
    LBRACK = '[';
    RBRACK = ']';
    LPAREN = '(';
    RPAREN = ')';
}

filter: expression EOF;

expression : or_expression;

or_expression : and_expression (OR and_expression)*;

and_expression : term (AND term)*;

term : atom (operator atom)? | LPAREN expression RPAREN;

atom : ID | INT | FLOAT | STRING | TRUE | FALSE;

operator : LT | GT | EQ | NEQ;

INT : '0'..'9'+;
FLOAT : ('0'..'9')+ '.' ('0'..'9')*;
STRING : '"' ('a'..'z'|'A'..'Z'|'_'|' ')* '"';
ID : ('a'..'z'|'A'..'Z'|'_') ('a'..'z'|'A'..'Z'|'0'..'9'|'_')*;

生成的解析树是:

The correct parse tree