为什么我的野牛/ flex无法正常工作?

时间:2019-04-07 15:53:09

标签: c linux bison flex-lexer

我有这个家庭作业,我必须将一些输入转换为特定的输出。我遇到的问题是,我只能将第一行转换为所需的输出,而其他行则返回“语法错误”错误。

另外,如果我更改行的顺序,则不会转换任何行,因此只有一条特定的行在起作用。

这是我的输入文件:

Input.txt

B0102 Bobi 2017/01/16 V8 1, massage 12.50
J1841 Jeco 20.2 2017/01/17 V8 2, Tosse 2, tosquia 22.50
B2232 Bobi 2017/01/17 Tosse 1, Leptospirose 1, bath 30.00, massage 12.50
B1841 Jeco 21.4 2017/01/18 Leptospirose 1, Giardiase 2

这是我应该获得的输出:

输出

Bobi (B0102) paid 2 services/vaccines 22.50
Jeco (J1841) paid 3 services/vaccines 62.50
Bobi (B2232) paid 4 services/vaccines 62.50
Jeco (B1841) paid 2 services/vaccines 30.00

如果我更改了输入文件中的行顺序,那么甚至第一行都不会转换。 但是,如果顺序如上所示,则为我的输出:

Bobi (B0102) paid 2 services/vaccines 22.50
syntax error

这是我的代码:

文件。y

%{
    #include "file.h"
    #include <stdio.h>
    int yylex();
    int counter = 0;
    int vaccineCost = 10;
%}

%union{
    char* code;
    char* name;
    float value;
    int quantity;
};

%token COMMA WEIGHT DATE SERVICE VACCINE
%token CODE
%token NAME
%token VALUE
%token QUANTITY

%type <name> NAME
%type <code> CODE
%type <value> VALUE
%type <quantity> QUANTITY
%type <value> services


%start begining

%%

begining: /*empty*/
    | animal
    ;

animal: CODE NAME WEIGHT DATE services {printf("%s (%s) paid %d services/vaccines %.2f\n", $2, $1, counter, $5); counter = 0;}
    | CODE NAME DATE services {printf("%s (%s) paid %d services/vaccines %.2f\n", $2, $1, counter, $4); counter = 0;}
    ;

services: services COMMA SERVICE VALUE {$$ = $1 + $4; counter++;}
    | services COMMA VACCINE QUANTITY{$$ = $1 + $4*vaccineCost;counter++;}
    | SERVICE VALUE{$$ = $2;counter++;}
    | VACCINE VALUE 
{$$ = $2*vaccineCost;counter++;}
    ;

%%

int main(){
    yyparse();
    return 0;
}

void yyerror (char const *s) {
    fprintf (stderr, "%s\n", s);
}

file.flex

%option noyywrap

%{
    #include "file.h"
    #include "file.tab.h"
    #include <stdio.h>
    #include <string.h>
%}

/*Patterns*/
YEAR 20[0-9]{2}
MONTH 0[1-9]|1[0-2]
DAY 0[1-9]|[1-2][0-9]|3[0-1]

%%
,                                   {return COMMA,;}
[A-Z][0-9]{4}            {yylval.code = strdup(yytext); return CODE;}       
[A-Z][a-z]*          {yylval.name = strdup(yytext); return NAME;}
[0-9]+[.][0-9]                             {return WEIGHT;}
{YEAR}"/"{MONTH}"/"{DAY}                           {return DATE;}
(banho|massagem|tosquia)                    {return SERVICE;}
[0-9]+\.[0-9]{2}              {yylval.value = atof(yytext);return VALUE;}
(V8|V10|Anti-Rabatica|Giardiase|Tosse|Leptospirose)          {return VACCINE;}
[1-9]           {yylval.quantity = atoi(yytext);return QUANTITY;}
\n  
.       
<<EOF>> return 0;

%%

这些是我执行的命令:

bison -d file.y
flex -o file.c file.flex
gcc file.tab.c file.c -o exec -lfl
./exec < Input.txt

有人能指出我正确的方向还是告诉我我的代码有什么问题?

谢谢,如果我的解释不够好,我会尽力更好地解释它!

1 个答案:

答案 0 :(得分:2)

至少有两种导致这些症状的问题。

  1. 您的顶级语法最多只接受一个List

    const { data, updateSearch, handleClick } = this.props;
    

    因此,不允许包含多行的输入。您需要一个可以接受任意数量data的顶层。 (顺便说一句,现代的野牛版本使您可以将animal写为空白作品的右侧,而不必(使用)注释。

  2. 扫描仪规则的顺序意味着您要识别为inicio: /*vazio*/ | animal 的大多数单词将改为被识别为animal。回想一下,当两个模式匹配相同的令牌时,文件wlll中的第一个将获胜。因此,遵循以下规则:

    %empty

    VACINA这样的令牌可以与任何一条规则匹配,将被认为与第一条规则匹配。只有NOME不匹配的V8和Anti-Rabatical才适用第二条规则。因此,您的第一个输入行不会触发此问题,而其他所有输入行都会触发。

除非您允许将治疗记录分成多行,否则您可能应该句法处理换行符。并且请注意,许多(f)lex版本不允许空操作,如最后两个flex规则中一样。这可能会导致词汇错误。

最后

[A-Z][a-z]*          {yylval.nome = strdup(yytext); return NOME;}
(V8|V10|Anti-Rabatica|Giardiase|Tosse|Leptospirose)          {return VACINA;}

是不必要的。这就是扫描仪默认情况下如何处理仿冒的方式。 Tosse规则通常是冗长的或多余的,仅应在明确需要时使用(并格外小心)。