在ANTLR中生成简单AST

时间:2010-11-10 11:38:42

标签: antlr antlr3 abstract-syntax-tree antlrworks

我正在玩ANTLR,并希望创建一个这样的函数:

MOVE x y z pitch roll

产生以下AST:

 MOVE
   |---x
   |---y
   |---z
   |---pitch
   |---roll

到目前为止,我已经尝试过没有运气,并且我一直让AST将参数作为兄弟姐妹,而不是孩子。

到目前为止

代码:

C#:

class Program
{
    const string CRLF = "\r\n";

    static void Main(string[] args)
    {
        string filename = "Script.txt";

        var reader = new StreamReader(filename);
        var input = new ANTLRReaderStream(reader);
        var lexer = new ScorBotScriptLexer(input);
        var tokens = new CommonTokenStream(lexer);
        var parser = new ScorBotScriptParser(tokens);

        var result = parser.program();
        var tree = result.Tree as CommonTree;
        Print(tree, "");

        Console.Read();
    }

    static void Print(CommonTree tree, string indent)
    {
        Console.WriteLine(indent + tree.ToString());

        if (tree.Children != null)
        {
            indent += "\t";

            foreach (var child in tree.Children)
            {
                var childTree = child as CommonTree;

                if (childTree.Text != CRLF)
                {
                    Print(childTree, indent);
                }
            }    
        }            
    }

ANTLR:

grammar ScorBotScript;

options
{
    language     = 'CSharp2';
    output       = AST;
    ASTLabelType = CommonTree;
    backtrack    = true;
    memoize      = true;
}

@parser::namespace { RSD.Scripting }
@lexer::namespace { RSD.Scripting }

program
    : (robotInstruction CRLF)*
    ;

robotInstruction
    : moveCoordinatesInstruction
    ;

/**
 * MOVE X Y Z PITCH ROLL
 */
moveCoordinatesInstruction
    : 'MOVE' x=INT y=INT z=INT pitch=INT roll=INT
    ;

INT : '-'? ( '0'..'9' )*
    ;

COMMENT
    :   '//' ~( CR | LF )* CR? LF { $channel = HIDDEN; }
    ;

WS
    :   ( ' ' | TAB | CR | LF ) { $channel = HIDDEN; }
    ;

ID  :   ('a'..'z'|'A'..'Z'|'_') ('a'..'z'|'A'..'Z'|'0'..'9'|'_')*
    ;

STRING
    :  '"' ( ESC_SEQ | ~('\\'|'"') )* '"'
    ;

fragment
ESC_SEQ
    :   '\\' ('b'|'t'|'n'|'f'|'r'|'\"'|'\''|'\\')
    ;

fragment TAB 
    : '\t' 
    ;

fragment CR 
    : '\r' 
    ;

fragment LF 
    : '\n' 
    ;

CRLF
    : (CR ? LF) => CR ? LF
    | CR
    ;

parse
    : ID
    | INT
    | COMMENT
    | STRING
    | WS
    ;

1 个答案:

答案 0 :(得分:7)

我自己是ANTLR的初学者,这也让我很困惑。

我认为如果你想从你的语法中创建一个具有结构的树,你可以使用^!字符来提升你的语法。 This examples page显示了如何。

从链接页面:

  

默认情况下,ANTLR会将树创建为   “兄弟姐妹名单”。

     

语法必须注明   tree命令生成一个解析器   创造正确形状的树木   (也就是根,运营商,哪个   作为孩子的操作数)。多一点   复杂的表达式解析器可以   在这里看到并以tar形式下载   这里。注意语法终端   这应该是一个根   子树用^。

注释