ANTLR链接1到1个语法规则一起解决条件

时间:2013-02-27 07:16:54

标签: conditional antlr4

如果你看一下ObjectiveC antlr v3语法(http://www.antlr3.org/grammar/1212699960054/ObjectiveC2ansi.g),以及许多其他流行的语法,他们会为解决条件问题做一个类似的结构

conditional_expression : logical_or_expression 
  ('?' logical_or_expression ':' logical_or_expression)? ;

constant_expression : conditional_expression ;

logical_or_expression : logical_and_expression 
  ('||' logical_and_expression)* ;

logical_and_expression : inclusive_or_expression 
  ('&&' inclusive_or_expression)* ;

inclusive_or_expression : exclusive_or_expression 
  ('|' exclusive_or_expression)* ;

exclusive_or_expression : and_expression ('^' and_expression)* ;

and_expression : equality_expression ('&' equality_expression)* ;

equality_expression : relational_expression 
  (('!=' | '==') relational_expression)* ;

relational_expression : shift_expression
 (('<' | '>' | '<=' | '>=') shift_expression)* ;

shift_expression : additive_expression (('<<' | '>>') additive_expression)* ;

additive_expression : multiplicative_expression
  (('+' | '-') multiplicative_expression)* ;

multiplicative_expression : cast_expression 
  (('*' | '/' | '%') cast_expression)* ;

cast_expression : '(' type_name ')' cast_expression | unary_expression ;

unary_expression 
  : postfix_expression
  | '++' unary_expression
  | '--' unary_expression
  | unary_operator cast_expression
  | 'sizeof' ('(' type_name ')' | unary_expression) ;

unary_operator : '&' | '*' | '-' | '~' | '!' ;

如果您阅读它,您会注意到他们执行从conditional_expressionlogical_or_expressionlogical_and_expressioninclusive_or_expression到{{1}的非常长的1对1条件链}}

现在,当谈到ANTLR时我很天真,但这让我觉得是一种解析条件的奇怪方法。对于logical_or_expression的定义来说,扭曲每个其他条件表达式类型似乎非常复杂。毕竟,逻辑exclusive_or_expression的定义与左按位移位有什么关系?

是否有更好的方法,或者是否需要使用此方法?

2 个答案:

答案 0 :(得分:5)

如前所述,需要“链”来正确处理运算符优先级。没有它,像1+2*3这样的输入将被解析为:

     *
    / \
   +   3
  / \
 1   2

而不是:

  +
 / \
1   *
   / \
  2   3

由于ANTLR 4支持直接左递归规则:

foo
 : foo '?' foo
 | TOKEN
 ;

所以不是间接的左递归规则:

foo
 : bar
 | TOKEN
 ;

bar
 : foo '?' foo
 ;

您可以按如下方式重写这些规则:

expression
 : '-' expression
 | '(' type_name ')' expression
 | expression ('*' | '/' | '%') expression
 | expression ('+' | '-') expression
 | expression ('<<' | '>>') expression
 | expression ('<' | '>' | '<=' | '>=') expression
 | expression ('!=' | '==') expression
 | expression '&' expression
 | expression '^' expression
 | expression '|' expression
 | expression '&&' expression
 | expression '||' expression
 | expression '?' expression ':' expression
 | IDENTIFIER
 | NUMBER
 ;

如果解析器现在偶然发现expression,它将首先查找('*' | '/' | '%'),如果不存在,则会查找('+' | '-')等。换句话说,在规则中首先放置的替代品将优先于规则中较低的替代品。

现在我从你之前的问题Once grammar is complete, what's the best way to walk an ANTLR v4 tree?得知,你正在使用一个听众来“走”树。如果您按照我刚刚展示的那样创建expression规则,则需要在enterExpression(...)exitExpression(...)方法中进行大量手动检查,以找出与expression匹配的expression {1}}。这就是“标签”派上用场的地方。您只需在expression : '-' expression #unaryExpr | '(' type_name ')' expression #castExpr | expression ('*' | '/' | '%') expression #multExpr | expression ('+' | '-') expression #addExpr | expression ('<<' | '>>') expression #... | expression ('<' | '>' | '<=' | '>=') expression | expression ('!=' | '==') expression | expression '&' expression | expression '^' expression | expression '|' expression | expression '&&' expression | expression '||' expression | expression '?' expression ':' expression | IDENTIFIER | NUMBER ; 规则中标记每个备选项:

enter

(请注意,当您标记一个时,必须将它们全部标记!)

然后基础监听器类将为所有替代方法提供exit - 和public void enterUnaryExpr(...) public void exitUnaryExpr(...) public void enterCastExpr(...) public void exitCastExpr(...) public void enterMultExpr(...) public void exitMultExpr(...) ... 方法:

{{1}}

答案 1 :(得分:0)

有一个很好的理由这样做:运算符优先级。以逻辑OR和左按位移位为例,考虑类似

的内容
if (a << b || c)

Objective-C优先规则说'&lt;&lt;'有优先权,所以评估这个的正确方法是

(a << b) || c

解析器规则通过使用您提到的链来管理它,因为“||”的规则在链中较高的位置,解析正确地给出&lt;&lt;&lt;&lt;&lt; b作为||的子表达式操作

在Antl3中没有更好的方法,但是在Antlr4中,因为Antlr4允许直接左递归规则。我强烈推荐“Definitive Antlr4参考”,因为它对这个问题有很好的解释。