Question

我正在尝试为元编程语言编写一个简单的解析器。一切正常，但我想用';'作为语句分隔符而不是换行符或完全省略分号。

所以这是预期的行为：

// good code
v1 = v2;
v3 = 23;

应该解析而不会出错

但是：

// bad code
v1 = v2
v3 = 23;

应该失败

如果我从分隔符删除'空'规则，则两个代码都会失败，如下所示：

ID to ID
Error detected in parsing: syntax error, unexpected ID, expecting SEMICOLON
;

如果我将'空'规则激活，则接受两个代码，这是不可取的。

ID to ID   // should raise error
ID to NUM;

欢迎任何帮助，因为大多数教程根本不包括分隔符。

以下是我的解析器/ lexxer的简化版本：

parser.l：

%{
#include "parser.tab.h"
#include<stdio.h>
%}

num      [0-9]
alpha    [a-zA-Z_]
alphanum [a-zA-Z_0-9]
comment "//"[^\n]*"\n"
string  \"[^\"]*\"
whitespace [ \t\n]

%x ML_COMMENT


%%
<INITIAL>"/*"               {BEGIN(ML_COMMENT); printf("/*");}
<ML_COMMENT>"*/"            {BEGIN(INITIAL); printf("*/");}  
<ML_COMMENT>[.]+            { }
<ML_COMMENT>[\n]+           { printf("\n"); }
{comment}+                  {printf("%s",yytext);}

{alpha}{alphanum}+          { yylval.str= strdup(yytext); return ID;}
{num}+                      { yylval.str= strdup(yytext); return NUM;}
{string}                    { yylval.str= strdup(yytext); return STRING;}

';'                         {return SEMICOLON;}
"="                         {return ASSIGNMENT;}
" "+                        { }
<<EOF>>                     {exit(0); /* this is suboptimal */}
%%

parser.y：

%{
#include<stdio.h>
#include<string.h>
%}

%error-verbose

%union{
        char *str;
}

%token  <str> ID
%token  <str> NUM
%token  <str> STRING
%left SEMICOLON
%left ASSIGNMENT

%start input

%%
input:  /* empty */
        | expression separator input
;

expression: assign 
            | error {}
;

separator:  SEMICOLON
            | empty
;

empty:      
;

assign:   ID ASSIGNMENT ID      { printf("ID to ID"); }
        | ID ASSIGNMENT STRING  { printf("ID to STRING"); }
        | ID ASSIGNMENT NUM     { printf("ID to NUM"); }
;

%%

yyerror(char* str)
{
        printf("Error detected in parsing: %s\n", str);
}

main()
{
        yyparse();
}

编译如下：

$>flex -t parser.l > parser.lex.yy.c
$>bison -v -d parser.y
$>cc parser.tab.c parser.lex.yy.c -lfl -o parser

Answer 1

没关系......问题在于这一行：

';'                         {return SEMICOLON;}

需要更改为

";"                         {return SEMICOLON;}

现在行为是正确的。： - ）

分号作为由flex / bison解析的自定义语法中的分隔符

1 个答案: