使用字符文字作为野牛的终端

时间:2012-11-02 15:24:45

标签: c bison yacc lex flex-lexer

我正在尝试理解flex / bison,但文档对我来说有点困难,而且我可能会误解某些东西。这是一个测试用例:http://namakajiri.net/misc/bison_charlit_test/

文件“a”包含单个字符“a”。 “foo.y”有这样一个简单的语法:

%%

file: 'a' ;

生成的解析器无法解析文件“a”;它给出了语法错误。

语法“bar.y”几乎相同,只是我更改了命名标记的字符文字:

%token TOK_A;

%%

file: TOK_A;

然后在bar.lex:

a       { return TOK_A; }

这个工作得很好。

在尝试将字符文字直接用作bison终端时,我做错了什么,就像在文档中一样?

我希望我的语法看起来像“statement:selector'{'property':'value';' '}'“而不是”声明:选择器LBRACE属性COLON值SEMIC RBRACE“......

我正在运行bison 2.5并在debian wheezy中运行2.5.35。

1 个答案:

答案 0 :(得分:3)

重写

问题是运行时问题,而不是编译时问题。

麻烦的是你有两个截然不同的词法分析器。

bar.lex分析器识别输入中的a并将其作为TOK_A返回,并忽略其他所有内容。

foo.lex分析器回应每一个字符,但这就是全部。

foo.lex - 正如所写

%{
#include "foo.tab.h"
%}

%%

foo.lex - 等效

%{
#include "foo.tab.h"
%}

%%
. { ECHO; }

foo.lex - 必需

%{
#include "foo.tab.h"
%}

%%
. { return *yytext; }

工作代码

这里有一些带有诊断打印的工作代码。

FOO-lex.l

%%
. { printf("Flex: %d\n", *yytext); return *yytext; }

foo.y

%{
#include <stdio.h>
void yyerror(char *s);
%}

%%

file: 'a' { printf("Bison: got file!\n") }
    ;

%%

int main(void)
{
    yyparse();
}

void yyerror(char *s)
{
    fprintf(stderr, "%s\n", s);
}

编译和执行

$ flex foo-lex.l
$ bison foo.y
$ gcc -o foo foo.tab.c lex.yy.c -lfl
$ echo a | ./foo
Flex: 97
Bison: got file!

$

详细点:该空白行是如何进入输出的?答:词法分析器把它放在那里。模式.与换行符不匹配,因此换行符被视为有规则:

\n    { ECHO; }

这就是输入被接受的原因。如果您将foo-lex.l文件更改为:

%%
.       { printf("Flex-1: %d\n", *yytext); return *yytext; }
\n      { printf("Flex-2: %d\n", *yytext); return *yytext; }

然后重新编译并再次运行,输出为:

$ echo a | ./foo
Flex-1: 97
Bison: got file!
Flex-2: 10
syntax error
$

没有空行。这是因为语法不允许换行符出现在有效的“#”文件中。