ANTLR4解析器生成:条件表达式的简单语法问题

时间:2018-04-25 03:19:29

标签: parsing antlr4

我正在尝试为简单语言生成词法分析器和解析器。目前,该语言只能解析条件表达式。一个条件表达式很像C语言中的一个,因为我只是在这里学习基础知识,所有我用C语言编写的问题我都不会关心实现。

我有以下语法:

grammar Simple ;

cond_expr     : left_paren operand operator operand right_paren ;
operand       : function_expr | ID | literal | cond_expr ;
function_expr : ID left_paren paramList right_paren ;
paramList     : param (',' param)* ;
param         : ID | function_expr ;
literal       : string | number ;
string        : '"' sentence '"' ;
sentence      : (WORD | WORD (' ' WORD)*)* ;
number        : INTEGER | FLOAT ;
left_paren    : LEFT_PAREN ;
right_paren   : RIGHT_PAREN ;
operator      : OPERATOR ;

INTEGER     : [0-9]+ ;
FLOAT       : INTEGER '.' INTEGER | '.' INTEGER ;
LEFT_PAREN  : '(' ;
RIGHT_PAREN : ')' ;
ID          : [A-Za-z]+[A-Za-z0-9_]* ;
WORD        : [A-Za-z]+ ;
OPERATOR    : ('==' | '>=' | '<=' | '!=' | '&&' | '||' | '~') ;
WS          : (' '|'\r'|'\n'|'\t') -> channel(HIDDEN);

当我在其上运行解析器时,我没有得到我期望的结果。以下是输出错误的示例:

~/sandbox $ grun Simple cond_expr -tree
(a (c, d (e, f)) != b)
line 1:2 mismatched input ' ' expecting OPERATOR
line 1:5 mismatched input ',' expecting OPERATOR
line 1:8 mismatched input ' ' expecting ')'
(cond_expr (left_paren () (operand a) (operator  ) (operand (cond_expr (left_paren () (operand c) (operator ,  ) (operand d) (right_paren   ( e ,   f))) (right_paren )))

我的语法有什么错误?任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:2)

似乎语法是所需DSL的EBNF表示的直接实现。需要做一些工作才能使它在ANTLR中正常工作。原样:

1)规则function_exprparamListparam存在相互左递归问题;

2)sentence无法匹配;

3)WS隐藏在词法分析器中,因此无论如何sentence永远不会匹配;);

4)ID规则阴影WORD,因此永远不会发出WORD个令牌。

(您应该在1和2上收到工具警告;永远不要忽略,因为警告表明运行时行为可能会受到影响。)

表达式规则的基本形式是在单个规则中列出表达式的所有替代形式。

expr  : LPAREN expr RPAREN 
      | expr operator expr
      | function
      | string
      | number
      | ID
      ;

function  : ID LPAREN ( ID | function ) (',' ( ID | function ))* RPAREN ;

string        : STRING ;
number        : INTEGER | FLOAT ;
operator      : OPERATOR ;

STRING : '"' .*? '"' ;

(未测试的)

所以(a (c, d (e, f)) != b)应正确评估

expr (function ( ID, function ( ID, ID ) ) operator ID