flex / bison第25行:''的语法错误。文件的最后一行

时间:2017-02-24 19:55:27

标签: bison flex-lexer bisonc++

我正在尝试编译一个flex proyect,但我总是得到相同的错误,我搜索所有的SO,并尝试大多数解决方案,例如使用令牌<>并返回1或0,或调用yywrap()...但没有运气。

我不知道错误在哪里,我有84个关于轮班/减少冲突的警告,但我可能是问题。

这是tokens.l:

%option yylineno

%{
 #include <string>
 #include <iostream>
 #include <vector>
 using namespace std ;
 #include "parser.hpp" 

 extern "C" int yywrap() { return(1); }
 #define TOKEN(t) processtoken(t, string(yytext, yyleng))

 void processtoken (int t, string id) {
   cout << t << " <" << id << ">" << endl ;
 }

%}

%option nounput

%%

programa                                TOKEN(RPROGRAM);
procedimiento                           TOKEN(RPROC);
variables                               TOKEN(RVAR);
si                                      TOKEN(RIF);
entonces                                TOKEN(RTHEN);
repetir                                 TOKEN(RREPEAT);
hasta                                   TOKEN(RUNTIL);
siempre                                 TOKEN(RALWAYS);
salir                                   TOKEN(RSALIR);
leer                                    TOKEN(RREAD);
escribir_linea                          TOKEN(RWRITE);
in                                      TOKEN(RIN);
out                                     TOKEN(ROUT);
entero                                  TOKEN(RENTERO);
real                                    TOKEN(RREAL);


[a-zA-Z](_?[a-zA-Z0-9])*                TOKEN(TID); 
\$[a-zA-Z](\-{0,1}[a-zA-Z0-9])*\-?      TOKEN(TID);
\$[a-zA-Z](\_{0,2}[a-zA-Z0-9])*         TOKEN(TID);
\(\*([^*]|\*+[^*)])*\*+\)               ; 

[ \t\n]                                 ;
[0-9]+\.[0-9]*                          TOKEN(TDOUBLE);
[0-9]+                                  TOKEN(TINTEGER); 
[0-9]+\.[0-9]+([eE][-+]?[0-9]+)?        TOKEN(TREAL);

"="                                     TOKEN(TASSIG);
"=="                                    TOKEN(TEQUAL);
">"                                     TOKEN(TCGT);
">="                                    TOKEN(TCGE);
"<"                                     TOKEN(TCLT);
"<="                                    TOKEN(TCLE);
"+"                                     TOKEN(TPLUS);
"-"                                     TOKEN(TMINUS);
"*"                                     TOKEN(TMUL);
"/"                                     TOKEN(TDIV);
"/="                                    TOKEN(TCNE);
"("                                     TOKEN(TLPAREN);
")"                                     TOKEN(TRPAREN);
"{"                                     TOKEN(TLBRACE);
"}"                                     TOKEN(TRBRACE);
","                                     TOKEN(TCOMMA);
":"                                     TOKEN(TCOLON);
";"                                     TOKEN(TSEMIC);

.                                       { cout << "Token desconocido: " << yytext << endl; yyterminate();}

%%

这是解析器.y:

%{
   #include <stdio.h>
   #include <iostream>
   #include <vector>
   #include <string>
   using namespace std; 

   extern int yylex();
   extern int yylineno;
   extern char *yytext;
   string tab = "\t" ;
   void yyerror (const char *msg) {
     printf("line %d: %s at '%s'\n", yylineno, msg, yytext) ;
   }


%}

%union {
    string  *str ; 
}

%token <str> RPROGRAM RPROC RVAR RIF RTHEN RREPEAT RUNTIL
%token <str> RALWAYS RSALIR RREAD RWRITE RENTERO RREAL
%token <str> RIN ROUT

%token <str> TID TDOUBLE TREAL TINTEGER

%token <str> TASSIG TEQUAL TCGT TCGE TCLT TCLE TCNE
%token <str> TPLUS TMINUS TMUL TDIV
%token <str> TLPAREN TRPAREN TLBRACE TRBRACE TCOMMA TCOLON TSEMIC

%type <str> programa
%type <str> declaraciones
%type <str> lista_de_ident
%type <str> resto_lista_id
%type <str> tipo
%type <str> decl_de_subprogs
%type <str> decl_de_subprograma
%type <str> argumentos
%type <str> lista_de_param
%type <str> clase_par
%type <str> resto_lis_de_param
%type <str> lista_de_sentencias
%type <str> sentencia
%type <str> variable
%type <str> expresion

%left TPLUS TMINUS TMUL TDIV

%start programa 

%%

programa :  RPROGRAM TID
        declaraciones
        decl_de_subprogs
        TLBRACE lista_de_sentencias TRBRACE
        ;


declaraciones : RVAR lista_de_ident TCOLON tipo TSEMIC declaraciones
        | {}
        ;

lista_de_ident : TID resto_lista_id
        ;

resto_lista_id : TCOMMA TID resto_lista_id
        | {}
        ;

tipo : RENTERO | RREAL
        ;

decl_de_subprogs : decl_de_subprograma decl_de_subprogs
        | {}
        ;

decl_de_subprograma : RPROC TID argumentos declaraciones
                    TLBRACE lista_de_sentencias TRBRACE
        ;

argumentos : TLPAREN lista_de_param TRPAREN
        | {}
        ;

lista_de_param : lista_de_ident TCOLON clase_par tipo resto_lis_de_param
        ;

clase_par : RIN | ROUT | RIN ROUT
        ;

resto_lis_de_param : TSEMIC lista_de_ident TCOLON clase_par tipo resto_lis_de_param
        | {}
        ;

lista_de_sentencias : sentencia lista_de_sentencias
        | {}
        ;

sentencia : variable TASSIG expresion TSEMIC
        | RIF expresion RTHEN TLBRACE lista_de_sentencias TRBRACE
        | RREPEAT TLBRACE lista_de_sentencias TRBRACE RUNTIL expresion TSEMIC
        | RREPEAT RALWAYS TLBRACE lista_de_sentencias TRBRACE
        | RSALIR RIF expresion
        | RREAD TLPAREN variable TRPAREN TSEMIC
        | RWRITE TLPAREN expresion TRPAREN TSEMIC
        ;

variable : TID
        ;

expresion : expresion TEQUAL expresion
        | expresion TCGT expresion
        | expresion TCLT expresion
        | expresion TCGE expresion
        | expresion TCLE expresion
        | expresion TCNE expresion
        | expresion TPLUS expresion
        | expresion TMINUS expresion
        | expresion TMUL expresion
        | expresion TDIV expresion
        | TID 
        | TINTEGER
        | TREAL
        | TLPAREN expresion TRPAREN
        ;

我尝试使用所有令牌的测试程序是下一个:

programa ejemplo
    variables a,b,c : entero;
    variables d,e : real;
(* esto es un comentario *)

procedimiento sumar (x,y: in entero; resul: in out entero) 
    variables aux:entero;
    {
        repetir {
            aux=x; 
            resul=y;
            aux = aux - 1;
            resul = resul+1;
        } hasta aux /= 0;
    }

{
    leer(a); leer(b);
    d= 1/b;
    e= 1/a;
    sumar(a,b,c); (* los que hagan llamadas a procedimientos *)
    c= c*(c*d)+e;
    escribir_linea(c*c);
}

我总是在最后一行得到错误:第25行:&#39;&#39;的语法错误,但我不知道这意味着什么,因为我有空格的令牌,EOF的令牌不起作用,我试过&lt;&lt; EOF&gt;&gt; {yywrap();}但它没有完成。

1 个答案:

答案 0 :(得分:1)

您的扫描仪定义中没有任何地方可以将令牌返回给解析器。因此,解析器看到的唯一标记是当它看到EOF时由flex自动返回的END标记。

但你的语法不接受空输入;它坚持输入中的第一个标记是programa(例如)。所以当它看到EOF时会自然地报告语法错误。

当检测到EOF时,没有令牌文本,因此yytext无效。 (它甚至可能是NULL,所以绝对不应该使用它。)总的来说,在词法分析器操作之外使用yytext并且在{{1中使用它}并不是一个好主意。调用未定义的行为(尽管您将不时在bison示例中看到它)。