使YACC输出AST(令牌树)

时间:2009-06-04 17:26:55

标签: parsing syntax yacc gppg

是否可以使YACC(或者我是我的MPPG)输出抽象语法树(AST)。

我正在阅读的所有内容都表明YACC很容易做到这一点,但是我很难知道你在建树时如何知道何时在树中移动一个节点。

3 个答案:

答案 0 :(得分:6)

扩展郝的观点并从the manual扩展,你想做类似以下的事情:

假设你有一个带有函数node的抽象语法树,它在树中创建了一个对象:

expr : expr '+' expr
  {  
     $$ = node( '+', $1, $3 );  
  }

此代码转换为“使用加号解析表达式时,请使用左右后代$1 / $3并将其用作节点的参数。将输出保存到$$(表达式的返回值。

$$(来自手册):

  

要返回值,通常会执行操作   将伪变量“$$”设置为某些   值。

答案 1 :(得分:5)

您是否看过the manual(搜索“解析树”以找到该位置)?它建议将节点创建放在一个动作中,左右后代为$ 1和$ 3,或者它们可能是什么。在这种情况下,yacc将代表您向上移动树而不是手动执行。

答案 2 :(得分:1)

其他答案建议修改语法,这在使用C ++语法(数百条规则......)时是不可行的。

幸运的是,我们可以通过重新定义调试宏来自动完成。 在此代码中,我们将YY_SYMBOL_PRINT重新定义为YYDEBUG

%{

typedef struct tree_t {
    struct tree_t **links;
    int nb_links;
    char* type; // the grammar rule
};

#define YYDEBUG 1
//int yydebug = 1;

tree_t *_C_treeRoot;
%}
%union tree_t

%start program

%token IDENTIFIER
%token CONSTANT

%left '+' '-'
%left '*' '/'
%right '^'

%%
progam: exprs { _C_treeRoot = &$1.t; }
    |
    | hack
    ;

exprs:
    expr ';'
    | exprs expr ';'
    ;


number:
    IDENTIFIER
    | '-' IDENTIFIER
    | CONSTANT
    | '-' CONSTANT
    ;

expr:
    number
    | '(' expr ')'
    | expr '+' expr
    | expr '-' expr
    | expr '*' expr
    | expr '/' expr
    | expr '^' expr
    ;

hack:
    {
    // called at each reduction in YYDEBUG mode
    #undef YY_SYMBOL_PRINT
    #define YY_SYMBOL_PRINT(A,B,C,D) \
        do { \
            int n = yyr2[yyn]; \
            int i; \
            yyval.t.nb_links = n; \
            yyval.t.links = malloc(sizeof *yyval.t.links * yyval.t.nb_links);\
            yyval.t.str = NULL; \
            yyval.t.type = yytname[yyr1[yyn]]; \
            for (i = 0; i < n; i++) { \
              yyval.t.links[i] = malloc(sizeof (YYSTYPE)); \
              memcpy(yyval.t.links[i], &yyvsp[(i + 1) - n], sizeof(YYSTYPE)); \
            } \
        } while (0)

    }
    ;
%%

#include "lexer.c"


int yyerror(char *s) {
    printf("ERROR : %s [ligne %d]\n",s, num_ligne);
    return 0;
}


int doParse(char *buffer)
{
    mon_yybuffer = buffer;
    tmp_buffer_ptr = buffer;
    tree_t *_C_treeRoot = NULL;
    num_ligne = 1;
    mon_yyptr = 0;

    int ret = !yyparse();

    /////////****
             here access and print the tree from    _C_treeRoot 
    ***///////////
}


char *tokenStrings[300] = {NULL};
char *charTokenStrings[512];

void initYaccTokenStrings()
{
    int k;
    for (k = 0; k < 256; k++)
    {
        charTokenStrings[2*k] = (char)k;
        charTokenStrings[2*k+1] = 0;
        tokenStrings[k] = &charTokenStrings[2*k];
    }
    tokenStrings[CONSTANT] = "CONSTANT";
    tokenStrings[IDENTIFIER] = "IDENTIFIER";


    extern char space_string[256];

    for (k = 0; k < 256; k++)
    {
        space_string[k] = ' ';
    }
}

叶子是在FLEX词法分析器中的RETURN之前创建的