LEX& YACC - 表达式中的空格

时间:2012-02-16 18:45:21

标签: c regex yacc lex

我正在读取一个文件,由于某种原因,当我尝试表达式时出现语法错误 比如5+5但是,如果我这样做5 + 5它就会很好。我很困惑为什么会这样做?

这是我的lex文件(我将遗漏读取文件的主文件):

%{

 #include "y.tab.h"
 #include "stdio.h"
 #include <stdlib.h>

%}
%%
(\/\*([^*]|(\*+([^*/]|[\r\n])))*\*+\/)+ {}
\/\/[^\n]*\n          {}
fd                    { return FD; }
[\r\t\n]+             {}
[ ]*                  {}
bk                    { return BK;}
setc                  {return SETC;}
[-+]?[0-9]+           { yylval = atoi(yytext); return NUMBER;}
fd[0-9]+              { }
rt                    {return RT;}
pink                  {return COLOR_TYPE;}
magenta               {return COLOR_TYPE; }
if                    {return IF; }
ifelse                {return IFELSE; }
\[                    {return LBRACKET; }
\]                    {return RBRACKET; }
\<                    {return LESS_THAN; }
\>                    {return GREATER_THAN; }
\+                    {return PLUS; }
\-                    {return MINUS; }
\/                    {return DIVIDE; }
\*                    {return MULT; }
\(                    {return LPAREN;}
\)                    {return RPAREN;}
\=                    {return EQ;}

%%

以下是我的yacc文件中处理表达式的部分:

expr    : NUMBER     { printf("EXPR-->NUMBER: %d\n", $1);}
   |expr PLUS expr   {$$ = $1 + $3; printf("EXPR-->expression PLUS expression: %d\n", $$);}
   |expr DIVIDE expr {$$ = $1 / $3; printf("EXPR-->expression DIVIDE expression %d\n", $$);}
   |expr MULT expr   {$$ = $1 * $3; printf("EXPR-->expression MULTIPLY expression %d\n", $$);}
   |expr MINUS expr  {$$ = $1 - $3; printf("EXPR-->expression MINUS expression %d\n", $$);}
   |COLOR_TYPE       {printf("EXPR-->COLOR\n");}
   ;

问题出在lex文件中吗?

1 个答案:

答案 0 :(得分:6)

tokenizer(lexer)将这两个返回给解析器:5+5。你的语法(和逻辑上)是无效的。

我认为,你最好改变你的词法分析器并改变运营商的规则。 (这意味着至少高于返回NUMBER)的规则。

编辑:经过一番思考(编辑#2:以及Jerry Coffin的有用评论),我建议更改NUMBER的词法规则到[0-9]+。为了使解析器仍然接受像“+123”或“-123”这样的输入,你应该将它添加到你的语法中:

%left PLUS MINUS ...
%right UNARY

%%

expr   : number
       | expr PLUS expr
      ...
       ;

number : PLUS NUMBER %prec UNARY {$$ = $2}
       | MINUS NUMBER %prec UNARY {$$ = -$2}
       | NUMBER 
       ;

这样可以在任意数字之前提供一元+-,同时仍然为运算符+-提供更高的优先级。