用Flex编写重入词法分析器

时间:2010-04-14 04:59:09

标签: thread-safety flex-lexer lexical-analysis reentrancy

我是flex的新手。我正在尝试用flex编写一个简单的重入词法分析器/扫描器。词法分析器的定义如下。我遇到编译错误,如下所示(yyg问题):

reentrant.l:

/* Definitions */

digit           [0-9]
letter          [a-zA-Z]
alphanum        [a-zA-Z0-9]
identifier      [a-zA-Z_][a-zA-Z0-9_]+
integer         [0-9]+
natural         [0-9]*[1-9][0-9]*
decimal         ([0-9]+\.|\.[0-9]+|[0-9]+\.[0-9]+)

%{
    #include <stdio.h>

    #define ECHO fwrite(yytext, yyleng, 1, yyout)

    int totalNums = 0;
%}

%option reentrant
%option prefix="simpleit_"

%%

^(.*)\r?\n     printf("%d\t%s", yylineno++, yytext);

%%
/* Routines */

int yywrap(yyscan_t yyscanner)
{
    return 1;
}

int main(int argc, char* argv[])
{
    yyscan_t yyscanner;

    if(argc < 2) {
        printf("Usage: %s fileName\n", argv[0]);
        return -1;
    }

    yyin = fopen(argv[1], "rb");

    yylex(yyscanner);

    return 0;
}

编译错误:

vietlq@mylappie:~/Desktop/parsers/reentrant$ gcc lex.simpleit_.c 
reentrant.l: In function ‘main’:
reentrant.l:44: error: ‘yyg’ undeclared (first use in this function)
reentrant.l:44: error: (Each undeclared identifier is reported only once
reentrant.l:44: error: for each function it appears in.)

1 个答案:

答案 0 :(得分:11)

对于可重入词法分析器,所有通信都必须包含状态,它包含在扫描程序中。

程序中的任何地方({em>例如<{em>} main内)您可以通过要传递扫描仪的特殊功能访问状态变量。 例如,在您原来的reentrant.l中,您可以这样做:

yyscan_t scanner;
yylex_init(&scanner);
yyset_in(fopen(argv[1], "rb"), scanner);
yylex(scanner);
yylex_destroy(scanner);

我已重命名scanner以避免在操作中与yyscanner混淆。与通用C代码相比,您的所有操作都发生在名为yylex的巨型函数中,该函数通过名称yyscanner传递给您的扫描程序。因此,yyscanner可用于您的所有操作。此外,yylex有一个名为yyg的局部变量,用于保存整个状态,大多数宏方便地引用yyg

虽然您可以像在自己的答案中一样定义yyin来使用main内的yyg宏,但不建议这样做。对于可重入词法分析器,宏仅用于操作。

要了解如何实现,您始终可以查看生成的代码:


/* For convenience, these vars
   are macros in the reentrant scanner. */
#define yyin yyg->yyin_r
...

/* Holds the entire state of the reentrant scanner. */
struct yyguts_t
...

#define YY_DECL int yylex (yyscan_t yyscanner)

/** The main scanner function which does all the work.
 */
YY_DECL
{
    struct yyguts_t * yyg = (struct yyguts_t*)yyscanner;
...
}

flex 文档中的reentrant选项还有很多内容,其中包括一个干净的编译示例。 (Google“ flex reentrant ”,并查找flex.sourceforge链接。)与 bison 不同, flex 相当直接可重入的模型。我强烈建议将重新使用 flex Lemon Parser一起使用,而不是使用 yacc / bison