Flex / Bison的格式输出

时间:2016-06-16 16:22:37

标签: parsing bison flex-lexer

我正在使用Flex和Bison来分析JSON。这就是我的Flex的样子:

%%

[ \n\t]+    
true        { return VAL_TRUE; }
false       { return VAL_FALSE; }
null        { return VAL_NULL; }
{STRING}    { yylval->string = strdup(yytext); return STRING; }
{NUMBER}    { yyval->number = atof(yytext); return NUMBER; }
\{          { return OBJ_BEG; }
\}          { return OBJ_END; }
:           { return SYM_COLON; }
,           { return SYM_COMMA; }

%%

我在Bison有这样的语法:

%%

START:      OBJECT                      { printf("%s\n", $1); }
    ;

OBJECT:     OBJ_BEG OBJ_END             { $$ = "{}\n"; }
    |       OBJ_BEG MEMBERS OBJ_END     { 
                                            $$ = ALLOC(2+strlen($2)+2); 
                                            sprintf($$,"{ %s }",$2); 
                                        }
    ;

MEMBERS:    PAIR                        { $$ = $1; }
    |       PAIR SYM_COMMA MEMBERS      { 
                                            $$ = ALLOC(strlen($1)+2+strlen($3)); 
                                            sprintf($$,"%s, %s",$1,$3); 
                                        }
    ;

PAIR:       STRING SYM_COLON VALUE      { 
                                            $$ = ALLOC(strlen($1)+2+strlen($3)); 
                                            sprintf($$,"%s: %s",$1,$3); 
                                        }
    ;

...

VALUE:      STRING                      { $$ = yylval.string; }
    |       NUMBER                      { $$ = yylval.number; }
    |       OBJECT                      { $$ = $1; }
    |       ARRAY                       { $$ = $1; }
    |       VAL_TRUE                    { $$ = "true"; }
    |       VAL_FALSE                   { $$ = "false"; }
    |       VAL_NULL                    { $$ = "null"; }
    ;

%%

使用所有这些我试图识别JSON。我也通过添加一些逗号,括号和空格来格式化输入。

但我遇到的问题是如何保存所有的换行符“\ n”以及我在输入JSON中的表格“\ n”并将它们直接发送到输出?现在我在Flex的“['n \ t] +”中忽略它们,然后在一些Bison的动作中手动添加空格。

这是我正在考虑的方法:

我可以在Flex中识别“\ n”和“\ t”,并将它们转发给Bison,作为SYM_LINEBREAK或SYM_TAB。但是如何在Bison的动作中将它们添加到输出中以及我在哪里放置这些规则/动作?

简要说明我需要做什么:添加一些空格,换行符和制表来输出和保存输入文件中的linbreaks和制表符(但不是空格)。

提前致谢!

1 个答案:

答案 0 :(得分:0)

空格与JSON语法无关 - 输入中任意两个标记之间可能出现任意数量的无关换行符或制表符,并且它不会影响json的含义(只要它不会分解)一个令牌)。因此,对于识别解析 json,你想要像你一样忽略它。

所以问题是,你想做什么?如果您只想将输入复制到输出而不进行任何更改,则根本不需要解析器。如果你想删除所有虚假的空白,你可以做你正在做的事情,但这太过分了。如果你想从json构建一个对象树(不是你当前正在做的那样),那么你需要一个像你一样的解析器,但你应该创建一个对象树而不是字符串。