Antlr离开了递归问题

时间:2010-01-21 23:09:12

标签: recursion antlr ll

我的Antlr语法中有一个左递归问题。虽然我认为我理解为什么有问题但我无法想到解决方案。问题出在我的数据类型规则的最后一行。我已经包含了整个语法供您查看:

grammar Test;

options {output=AST;ASTLabelType=CommonTree;}
tokens {FUNCTION; ATTRIBUTES; CHILDREN; COMPOSITE;}

program     :   function ;
function    :   ID (OPEN_BRACKET (attribute (COMMA? attribute)*)? CLOSE_BRACKET)? (OPEN_BRACE function* CLOSE_BRACE)? SEMICOLON? -> ^(FUNCTION ID ^(ATTRIBUTES attribute*) ^(CHILDREN function*)) ;

attribute   :   ID (COLON | EQUALS)  datatype -> ^(ID datatype);

datatype    :   ID      ->  ^(STRING["id"] ID)
            |   NUMBER  ->  ^(STRING["number"] NUMBER)
            |   STRING  ->  ^(STRING["string"] STRING)
            |   BOOLEAN ->  ^(STRING["boolean"] BOOLEAN)
            |   array   ->  ^(STRING["array"] array)
            |   lookup  ->  ^(STRING["lookup"] lookup)
            |   datatype PLUS datatype -> ^(COMPOSITE datatype datatype) ;

array       :   OPEN_BOX (datatype (COMMA datatype)*)? CLOSE_BOX -> datatype* ;
lookup      :   OPEN_BRACE (ID (PERIOD ID)*) CLOSE_BRACE -> ID* ;

NUMBER
    :   ('+' | '-')? (INTEGER | FLOAT)
    ;

STRING
    :  '"' ( ESC_SEQ | ~('\\'|'"') )* '"'
    ;

BOOLEAN
    :   'true' | 'TRUE' | 'false' | 'FALSE'
    ;

ID  :   (LETTER|'_') (LETTER | INTEGER |'_')*
    ;

COMMENT
    :   '//' ~('\n'|'\r')* '\r'? '\n' {$channel=HIDDEN;}
    |   '/*' ( options {greedy=false;} : . )* '*/' {$channel=HIDDEN;}
    ;

WHITESPACE  :   (' ' | '\t' | '\r' | '\n') {$channel=HIDDEN;} ;

COLON   :   ':' ;
SEMICOLON   :   ';' ;

COMMA   :   ',' ;
PERIOD  :   '.' ;
PLUS    :   '+' ;
EQUALS  :   '=' ;   

OPEN_BRACKET    :   '(' ;
CLOSE_BRACKET   :   ')' ;

OPEN_BRACE  :   '{' ;   
CLOSE_BRACE :   '}' ;

OPEN_BOX    :   '[' ;
CLOSE_BOX   :   ']' ;

fragment
LETTER
    :   'a'..'z' | 'A'..'Z' 
    ;

fragment
INTEGER
    :   '0'..'9'+
    ;

fragment
FLOAT
    :   INTEGER+ '.' INTEGER*
    ;

fragment
ESC_SEQ
    :   '\\' ('b'|'t'|'n'|'f'|'r'|'\"'|'\''|'\\')
    ;

我正在开发使用Antlr工程,它提供了解决此问题的功能 - 但不幸的是它似乎不起作用:s

任何帮助都会很棒。

感谢。

编辑:

以下是我尝试实现/解析

的语言示例
<FunctionName> <OptionalAttributes> <OptionalChildFunctions>

例如:

ForEach(in:[1,2,3,4,5] as:"i") {
  Switch(value:{i}) {
    Case(value:3) {
      Print(message:"This is the number 3")
    }

    Default {
       Print(message:"This isn't the number 3")
    }
 }
}

1 个答案:

答案 0 :(得分:2)

好的,这应该可以解决问题:

grammar Test;

/************************************** PARSER **************************************/
program
    :   function EOF 
    ;

function
    :   ID (OPEN_PAREN (attribute (COMMA attribute)*)? CLOSE_PAREN)?
        (OPEN_BRACE function* CLOSE_BRACE)?
        SEMICOLON?
    ;

attribute
    :   ID (COLON | EQUALS)? expression
    ;

expression
    :   atom (PLUS atom)*
    ;

atom
    :   ID
    |   STRING
    |   BOOLEAN
    |   NUMBER
    |   array
    |   lookup
    ;

array
    :   OPEN_BOX (expression (COMMA expression)*)? CLOSE_BOX
    ;

lookup
    :   OPEN_BRACE (ID (PERIOD ID)*) CLOSE_BRACE
    ;

/************************************** LEXER **************************************/
NUMBER          :   ('+' | '-')? (INTEGER | FLOAT)
                ;

STRING          :  '"' ( ESC_SEQ | ~('\\'|'"') )* '"'
                ;

BOOLEAN         :   'true' | 'TRUE' | 'false' | 'FALSE'
                ;

ID              :   (LETTER|'_') (LETTER | INTEGER |'_')*
                ;

COMMENT         :   '//' ~('\n'|'\r')* ('\r'? '\n'| EOF) {$channel=HIDDEN;}
                |   '/*' ( options {greedy=false;} : . )* '*/' {$channel=HIDDEN;}
                ;

WHITESPACE      :   (' ' | '\t' | '\r' | '\n') {$channel=HIDDEN;} ;

COLON           :   ':' ;
SEMICOLON       :   ';' ;

COMMA           :   ',' ;
PERIOD          :   '.' ;
PLUS            :   '+' ;
EQUALS          :   '=' ;   

OPEN_PAREN      :   '(' ;
CLOSE_PAREN     :   ')' ;

OPEN_BRACE      :   '{' ;   
CLOSE_BRACE     :   '}' ;

OPEN_BOX        :   '[' ;
CLOSE_BOX       :   ']' ;

fragment 
LETTER          :   'a'..'z' | 'A'..'Z' ;
fragment
INTEGER         :   '0'..'9'+ ;
fragment
FLOAT           :   INTEGER+ '.' INTEGER* ;
fragment
ESC_SEQ         :   '\\' ('b'|'t'|'n'|'f'|'r'|'\"'|'\''|'\\') ;

请注意,我已将OPEN_BRACKETCLOSE_BRACKET的名称更改为OPEN_PARENCLOSE_PAREN。圆形的()是括号,方括号[]称为括号(您称之为方框,但称为方框)不会伤害IMO。