野牛转移/减少冲突/减少/减少冲突警告

时间:2015-09-28 11:22:37

标签: warnings bison shift-reduce-conflict

当我在Ubuntu Linux中运行这个野牛代码时,我得到以下警告: 1shift / reduce冲突[-Wconflicts-sr] 2减少/减少冲突[-Wcolficts-sr]

以下是更清晰的屏幕截图: http://i.imgur.com/iznzSsn.png

编辑:减少/减少错误 第86行:typos_dedomenwn 第101行:typos_synartisis

并且shift / reduce错误在: 第129行:entoli_if

我无法找到如何解决这些问题,有人会帮忙吗?

以下是野牛代码:

        %{

        #include <stdio.h>
        #include <stdlib.h>
        #include <string.h>

        int totalerrors=0;

        extern int yylex();
        extern FILE *yyin;
        extern int lineno; //Arithmos grammis pou kanei parse

        //error handling
        void yyerror(const char *msg) {
        }
        //filling the error array
        void printError(char y[],int x){
            //param 1: error string
            //param 2: line number
            char temp[15];
            char temp2[5];
            char final[256];
            sprintf(temp2,"%d: ",x);
            strcpy(temp, "In Line ");
            strcat(temp,temp2);
            strcpy(final,"");
            strcat(final,temp);
            strcat(final,y);
            printf("%d) %s\n",totalerrors+1,final);
            totalerrors++;
        }
        %}
        %start start
        %token T_sigkritikos_telestis
        %token T_typos_dedomenwn
        %token T_typos_synartisis
        %token T_stathera
        %token T_newline
        %token T_kefalida_programmatos
        %token T_extern
        %token T_void
        %token T_return
        %token T_if
        %token T_else
        %token T_plus
        %token T_minus
        %token T_mult
        %token T_div
        %token T_percentage
        %token T_int
        %token T_bool
        %token T_string
        %token T_true
        %token T_false
        %token T_id
        %token T_semic
        %token T_comma
        %token T_openpar
        %token T_closepar
        %token T_ampersand
        %token T_begin
        %token T_end
        %token T_excl
        %token T_or
        %token T_equals
        %token T_semileft
        %token T_semiright
        %%
        start: exwterikes_dilwseis T_kefalida_programmatos tmima_orismwn tmima_entolwn;

        exwterikes_dilwseis: exwteriko_prwtotypo exwterikes_dilwseis
            | ;

        exwteriko_prwtotypo: T_extern prwtotypo_synartisis;

        tmima_orismwn: orismos tmima_orismwn
            | ;

        orismos: orismos_metavlitwn
            | orismos_synartisis
            | prwtotypo_synartisis;

        orismos_metavlitwn: typos_dedomenwn lista_metavlitwn T_semic;

        typos_dedomenwn: T_int
            | T_bool
            | T_string;

        loop1: T_comma T_id
            | ;

        lista_metavlitwn: T_id loop1;

        orismos_synartisis: kefalida_synartisis tmima_orismwn tmima_entolwn;

        prwtotypo_synartisis: kefalida_synartisis T_semic;

        kefalida_synartisis: typos_synartisis T_id T_openpar lista_typikwn_parametrwn T_closepar
            | typos_synartisis T_id T_openpar T_closepar;

        typos_synartisis: T_int
            | T_bool
            | T_void;

        lista_typikwn_parametrwn: typikes_parametroi loop2;

        loop2: T_comma typikes_parametroi
            | ;

        typikes_parametroi: typos_dedomenwn T_ampersand T_id;

        tmima_entolwn: T_begin loop3 T_end;

        loop3: entoli loop3
            | ;

        entoli: apli_entoli T_semic
            | domimeni_entoli
            | sintheti_entoli;

        sintheti_entoli: T_semileft loop3 T_semiright;

        domimeni_entoli: entoli_if;

        apli_entoli: anathesi 
            | klisi_sunartisis
            | entoli_return
            | ;

        entoli_if: T_if T_openpar geniki_ekfrasi T_closepar entoli else_clause 
            | T_if T_openpar geniki_ekfrasi T_closepar entoli;

        else_clause: T_else entoli;

        anathesi: T_id T_equals geniki_ekfrasi;

        klisi_sunartisis: T_id T_openpar lista_pragmatikwn_parametrwn T_closepar 
            | T_id T_openpar T_closepar;

        lista_pragmatikwn_parametrwn: pragmatiki_parametros loop4;

        loop4: T_semic pragmatiki_parametros loop4
            | ;

        pragmatiki_parametros: geniki_ekfrasi;

        entoli_return: T_return geniki_ekfrasi 
            | T_return;

        geniki_ekfrasi: genikos_oros loop5;

        loop5: T_or T_or genikos_oros loop5
            | ;

        genikos_oros: genikos_paragontas loop6;

        loop6: T_ampersand T_ampersand loop6 
            | ;

        genikos_paragontas: T_excl genikos_protos_paragontas
            | genikos_protos_paragontas;

        genikos_protos_paragontas: apli_ekfrasi tmima_sigrisis
            | apli_ekfrasi;

        tmima_sigrisis: T_sigkritikos_telestis apli_ekfrasi;



        apli_ekfrasi: aplos_oros loop7;

        loop7: T_plus aplos_oros loop7
            | T_minus aplos_oros loop7
            | ;

        aplos_oros: aplos_paragontas loop8;

        loop8: T_mult aplos_paragontas loop8
            | T_div aplos_paragontas loop8
            | T_percentage aplos_paragontas loop8
            | ;

        aplos_paragontas: T_plus aplos_prot_oros
            | T_minus aplos_prot_oros
            | aplos_prot_oros;

        aplos_prot_oros: T_id
            | stathera
            | klisi_sunartisis
            | T_openpar geniki_ekfrasi T_closepar;

        stathera: T_true
            |T_false;

        %%
        int main(int argc, char *argv[]){
            ++argv; --argc;  //agnooume to onoma tou exe
            if (argc==1) {
                FILE *fp = fopen(argv[0],"r");
                if (fp!=NULL) {
                    printf("Reading input from file: %s\n",argv[0]);
                    printf("Output:\n\n");
                    yyin = fp;
                    yyparse();
                } else {
                    printf("File doesn't exist\n");
                    return 1;
                }
            } else if (argc>1) {
                printf("Only one file allowed for input...\n");
                return 1;
            } else {
                printf ("Parsing from stdin..\n");
                yyparse();
            }
            if (totalerrors==0) {
                printf("All good!\n");
                printf("===================================\n");
                printf("Parsing complete! No errors found!!\n");
            } else {
                printf("===================================\n");
                printf("Total Errors: %d\n",totalerrors);
            }
            return 0;
        }

1 个答案:

答案 0 :(得分:5)

甲。冗余非终端

减少/减少冲突是因为您有两个非终端只存在于不同类型的聚合:

typos_dedomenwn: T_int
    | T_bool
    | T_string;

typos_synartisis: T_int
    | T_bool
    | T_string;

在使用这些非终端的情况下,解析器不可能知道哪一个适用;直到声明的进一步说,它才能分辨出来。但是,这并不重要。您可以定义一个typos非终端,并在整个过程中使用它:

typos: T_int
    | T_bool
    | T_string;

orismos_metavlitwn: typos lista_metavlitwn T_semic;
kefalida_synartisis: typos T_id T_openpar lista_typikwn_parametrwn T_closepar
    | typos T_id T_openpar T_closepar;
typikes_parametroi: typos T_ampersand T_id;

B中。晃来晃去其他

转移/减少冲突是&#34; C&#34;的经典问题。样式if语句。这些陈述难以以不含糊不清的方式描述。考虑:

if (expr1) if (expr2) statement1; else statement2;

我们知道else必须与第二 if匹配,因此上述内容相当于:

if (expr1) { if (expr2) statement1; else statement2; }

但语法也与其他可能的解析相匹配,相当于:

if (expr1) { if (expr2) statement1; } else statement2;

这个问题有三种可能的解决方案:

  1. 什么都不做。 Bison在这里做了正确的事情,设计:它总是喜欢&#34;转移&#34;结束&#34;减少&#34;。这意味着,如果else可以与开放的if语句匹配,那么野牛将始终这样做,而不是保持else以匹配某些外部if语句。龙书中有很好的描述,以及其他地方。

    这个解决方案的问题在于你仍然会收到关于转换/减少冲突的警告,而且很难区分&#34; OK&#34;冲突,新创造的&#34;不行&#34;冲突。 Bison提供了%expect声明,因此您可以告诉它您预期会发生多少冲突,如果找到了正确的数字,将会取消警告,但这仍然非常脆弱。

  2. 使用优先级声明。这些在bison manual.中有描述,它们用于解决悬空的其他问题是该章中的一个运行示例。在你的情况下,它看起来像这样:

    %precedence T_then  /* Fake terminal, needed for %prec */
    %precedence T_else
     /* ... */
    %%
     /* ... */
    
    entoli_if: T_if T_openpar geniki_ekfrasi Tw_closepar entoli T_else entoli
       | T_if T_openpar geniki_ekfrasi T_closepar entoli %prec T_then
    

    在这里,我已经删除了不必要的非终端else_clause,因为它隐藏了else令牌。如果您想保留它,无论出于何种原因,您需要在使用它的%prec T_else制作的末尾添加entoli_if

    %precedence声明只能从bison 3.0开始提供。如果您有早期版本的bison,则可以使用%nonassoc声明,但这可能会隐藏其他一些错误。

  3. 修复语法。实际上可以制作一个明确的语法,但它有点工作。

    重点在于:

    if (expr) statement1 else statement2
    

    statement1不能是无法匹配的if语句。如果statement1if语句,则必须包含else条款;否则,外else中的if将与内if匹配。并且递归地应用于statement1中的任何尾随语句,例如

    if (e2) statement2; 
      else if (e3) statement3
      else /* must be present */ statement;
    

    我们可以通过将陈述分为&#34;匹配&#34;来表达这一点。语句(所有ifelse匹配)和&#34;不匹配&#34;陈述:(我还没有尝试在这里保留希腊非终端名称;对不起。你必须根据你的语法调整这个想法。)

    statement: matching_statement | non_matching_statement ;
    matching_statement: call_statement | assignment_statement | ...
        | matching_if_statement
    non_matching_statement: non_matching_if_statement
        /* might be others, see below */
    
    if_condition: "if" '(' expression ')' ;
    
    matching_if_statement:
          if_condition matching_statement "else" matching_statement ;
    non_matching_if_statement:
          if_condition statement
        | if_condition matching_statement "else" non_matching_statement
        ; 
    

    在C中,还有其他复合语句可以以语句(whilefor)结尾。这些中的每一个也都有一个匹配的&#34;和&#34;不匹配&#34;版本,取决于最终语句是匹配还是不匹配:

    while_condition: "while" '(' expression ')' ;
    matching_while_statement: while_condition matching_statement ;
    non_matching_while_statement: while_condition non_matching_statement ;
    

    据我所知,这不适用于您的语言,但您可能希望将来扩展它以包含此类声明。

  4. ℃。关于野牛风格的一些注意事项

    1. Bison允许您使用单个字符标记作为自己,用单引号括起来。因此,您可以只编写T_openpar,而不是声明'('然后编写使用它的详细规则。你甚至不需要宣布它。 (在您的flex - 或其他 - 扫描仪中,您只需return '(';而不是return T_openpar,这就是您不需要声明令牌的原因。)这通常会使语法更具可读性

    2. Bison还允许您为令牌指定一个人类可读的名称。 (此功能并非在所有yacc衍生产品中,但它非常常见。),这也可以使语法更具可读性。例如,您可以为ifelse令牌指定名称,如下所示:

      %token T_if "if"
      %token T_else "else"
      

      然后你可以在你的语法规则中使用引用的字符串。 (我在上一个例子中就悬挂的其他问题做了这一点。)在弹性扫描仪中,你仍然需要使用标记符号T_ifT_else

    3. 如果您有一个双符号标记,如&&,通常情况下,如果扫描程序识别它并返回单个标记,而不是解析器识别两个连续的&标记。在第二种情况下,解析器将识别:

      boolean_expr1 &  & boolean_expr2
      
      好像已经写好了

      boolean_expr1 && boolean_expr2
      

      虽然第一个很可能是应报告的错误。

    4. Bison是一个自下而上的LALR(1)解析器生成器。没有必要删除左递归。自下而上的解析器更喜欢左递归,左递归语法通常更准确,更容易阅读。例如,最好全面宣布:

      apli_ekfrasi: aplos_oros
          | apli_ekfrasi '+' aplos_oros
          | apli_ekfrasi '-' aplos_oros;
      

      而不是在你的语法中使用LL风格的重复后缀(loop7)。左递归语法可以在不扩展解析器堆栈的情况下进行解析,并且更准确地表示表达式的语法结构,使得解析器操作更容易编写。

      您的语法中还有许多其他地方可能需要重温。

      (这个建议直接来自bison manual:&#34;你应该总是使用左递归,因为它可以解析具有有限堆栈空间的任意数量元素的序列。&#34;)