我正在尝试为元编程语言编写一个简单的解析器。 一切正常,但我想用';'作为语句分隔符而不是换行符或完全省略分号。
所以这是预期的行为:
// good code
v1 = v2;
v3 = 23;
应该解析而不会出错
但是:
// bad code
v1 = v2
v3 = 23;
应该失败
如果我从分隔符删除'空'规则,则两个代码都会失败,如下所示:
ID to ID
Error detected in parsing: syntax error, unexpected ID, expecting SEMICOLON
;
如果我将'空'规则激活,则接受两个代码,这是不可取的。
ID to ID // should raise error
ID to NUM;
欢迎任何帮助,因为大多数教程根本不包括分隔符。
以下是我的解析器/ lexxer的简化版本:
parser.l:
%{
#include "parser.tab.h"
#include<stdio.h>
%}
num [0-9]
alpha [a-zA-Z_]
alphanum [a-zA-Z_0-9]
comment "//"[^\n]*"\n"
string \"[^\"]*\"
whitespace [ \t\n]
%x ML_COMMENT
%%
<INITIAL>"/*" {BEGIN(ML_COMMENT); printf("/*");}
<ML_COMMENT>"*/" {BEGIN(INITIAL); printf("*/");}
<ML_COMMENT>[.]+ { }
<ML_COMMENT>[\n]+ { printf("\n"); }
{comment}+ {printf("%s",yytext);}
{alpha}{alphanum}+ { yylval.str= strdup(yytext); return ID;}
{num}+ { yylval.str= strdup(yytext); return NUM;}
{string} { yylval.str= strdup(yytext); return STRING;}
';' {return SEMICOLON;}
"=" {return ASSIGNMENT;}
" "+ { }
<<EOF>> {exit(0); /* this is suboptimal */}
%%
parser.y:
%{
#include<stdio.h>
#include<string.h>
%}
%error-verbose
%union{
char *str;
}
%token <str> ID
%token <str> NUM
%token <str> STRING
%left SEMICOLON
%left ASSIGNMENT
%start input
%%
input: /* empty */
| expression separator input
;
expression: assign
| error {}
;
separator: SEMICOLON
| empty
;
empty:
;
assign: ID ASSIGNMENT ID { printf("ID to ID"); }
| ID ASSIGNMENT STRING { printf("ID to STRING"); }
| ID ASSIGNMENT NUM { printf("ID to NUM"); }
;
%%
yyerror(char* str)
{
printf("Error detected in parsing: %s\n", str);
}
main()
{
yyparse();
}
编译如下:
$>flex -t parser.l > parser.lex.yy.c
$>bison -v -d parser.y
$>cc parser.tab.c parser.lex.yy.c -lfl -o parser
答案 0 :(得分:1)
没关系......问题在于这一行:
';' {return SEMICOLON;}
需要更改为
";" {return SEMICOLON;}
现在行为是正确的。 : - )