当我在Ubuntu Linux中运行这个野牛代码时,我得到以下警告: 1shift / reduce冲突[-Wconflicts-sr] 2减少/减少冲突[-Wcolficts-sr]
以下是更清晰的屏幕截图: http://i.imgur.com/iznzSsn.png
编辑:减少/减少错误 第86行:typos_dedomenwn 第101行:typos_synartisis
并且shift / reduce错误在: 第129行:entoli_if
我无法找到如何解决这些问题,有人会帮忙吗?
以下是野牛代码:
%{
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int totalerrors=0;
extern int yylex();
extern FILE *yyin;
extern int lineno; //Arithmos grammis pou kanei parse
//error handling
void yyerror(const char *msg) {
}
//filling the error array
void printError(char y[],int x){
//param 1: error string
//param 2: line number
char temp[15];
char temp2[5];
char final[256];
sprintf(temp2,"%d: ",x);
strcpy(temp, "In Line ");
strcat(temp,temp2);
strcpy(final,"");
strcat(final,temp);
strcat(final,y);
printf("%d) %s\n",totalerrors+1,final);
totalerrors++;
}
%}
%start start
%token T_sigkritikos_telestis
%token T_typos_dedomenwn
%token T_typos_synartisis
%token T_stathera
%token T_newline
%token T_kefalida_programmatos
%token T_extern
%token T_void
%token T_return
%token T_if
%token T_else
%token T_plus
%token T_minus
%token T_mult
%token T_div
%token T_percentage
%token T_int
%token T_bool
%token T_string
%token T_true
%token T_false
%token T_id
%token T_semic
%token T_comma
%token T_openpar
%token T_closepar
%token T_ampersand
%token T_begin
%token T_end
%token T_excl
%token T_or
%token T_equals
%token T_semileft
%token T_semiright
%%
start: exwterikes_dilwseis T_kefalida_programmatos tmima_orismwn tmima_entolwn;
exwterikes_dilwseis: exwteriko_prwtotypo exwterikes_dilwseis
| ;
exwteriko_prwtotypo: T_extern prwtotypo_synartisis;
tmima_orismwn: orismos tmima_orismwn
| ;
orismos: orismos_metavlitwn
| orismos_synartisis
| prwtotypo_synartisis;
orismos_metavlitwn: typos_dedomenwn lista_metavlitwn T_semic;
typos_dedomenwn: T_int
| T_bool
| T_string;
loop1: T_comma T_id
| ;
lista_metavlitwn: T_id loop1;
orismos_synartisis: kefalida_synartisis tmima_orismwn tmima_entolwn;
prwtotypo_synartisis: kefalida_synartisis T_semic;
kefalida_synartisis: typos_synartisis T_id T_openpar lista_typikwn_parametrwn T_closepar
| typos_synartisis T_id T_openpar T_closepar;
typos_synartisis: T_int
| T_bool
| T_void;
lista_typikwn_parametrwn: typikes_parametroi loop2;
loop2: T_comma typikes_parametroi
| ;
typikes_parametroi: typos_dedomenwn T_ampersand T_id;
tmima_entolwn: T_begin loop3 T_end;
loop3: entoli loop3
| ;
entoli: apli_entoli T_semic
| domimeni_entoli
| sintheti_entoli;
sintheti_entoli: T_semileft loop3 T_semiright;
domimeni_entoli: entoli_if;
apli_entoli: anathesi
| klisi_sunartisis
| entoli_return
| ;
entoli_if: T_if T_openpar geniki_ekfrasi T_closepar entoli else_clause
| T_if T_openpar geniki_ekfrasi T_closepar entoli;
else_clause: T_else entoli;
anathesi: T_id T_equals geniki_ekfrasi;
klisi_sunartisis: T_id T_openpar lista_pragmatikwn_parametrwn T_closepar
| T_id T_openpar T_closepar;
lista_pragmatikwn_parametrwn: pragmatiki_parametros loop4;
loop4: T_semic pragmatiki_parametros loop4
| ;
pragmatiki_parametros: geniki_ekfrasi;
entoli_return: T_return geniki_ekfrasi
| T_return;
geniki_ekfrasi: genikos_oros loop5;
loop5: T_or T_or genikos_oros loop5
| ;
genikos_oros: genikos_paragontas loop6;
loop6: T_ampersand T_ampersand loop6
| ;
genikos_paragontas: T_excl genikos_protos_paragontas
| genikos_protos_paragontas;
genikos_protos_paragontas: apli_ekfrasi tmima_sigrisis
| apli_ekfrasi;
tmima_sigrisis: T_sigkritikos_telestis apli_ekfrasi;
apli_ekfrasi: aplos_oros loop7;
loop7: T_plus aplos_oros loop7
| T_minus aplos_oros loop7
| ;
aplos_oros: aplos_paragontas loop8;
loop8: T_mult aplos_paragontas loop8
| T_div aplos_paragontas loop8
| T_percentage aplos_paragontas loop8
| ;
aplos_paragontas: T_plus aplos_prot_oros
| T_minus aplos_prot_oros
| aplos_prot_oros;
aplos_prot_oros: T_id
| stathera
| klisi_sunartisis
| T_openpar geniki_ekfrasi T_closepar;
stathera: T_true
|T_false;
%%
int main(int argc, char *argv[]){
++argv; --argc; //agnooume to onoma tou exe
if (argc==1) {
FILE *fp = fopen(argv[0],"r");
if (fp!=NULL) {
printf("Reading input from file: %s\n",argv[0]);
printf("Output:\n\n");
yyin = fp;
yyparse();
} else {
printf("File doesn't exist\n");
return 1;
}
} else if (argc>1) {
printf("Only one file allowed for input...\n");
return 1;
} else {
printf ("Parsing from stdin..\n");
yyparse();
}
if (totalerrors==0) {
printf("All good!\n");
printf("===================================\n");
printf("Parsing complete! No errors found!!\n");
} else {
printf("===================================\n");
printf("Total Errors: %d\n",totalerrors);
}
return 0;
}
答案 0 :(得分:5)
减少/减少冲突是因为您有两个非终端只存在于不同类型的聚合:
typos_dedomenwn: T_int
| T_bool
| T_string;
typos_synartisis: T_int
| T_bool
| T_string;
在使用这些非终端的情况下,解析器不可能知道哪一个适用;直到声明的进一步说,它才能分辨出来。但是,这并不重要。您可以定义一个typos
非终端,并在整个过程中使用它:
typos: T_int
| T_bool
| T_string;
orismos_metavlitwn: typos lista_metavlitwn T_semic;
kefalida_synartisis: typos T_id T_openpar lista_typikwn_parametrwn T_closepar
| typos T_id T_openpar T_closepar;
typikes_parametroi: typos T_ampersand T_id;
转移/减少冲突是&#34; C&#34;的经典问题。样式if
语句。这些陈述难以以不含糊不清的方式描述。考虑:
if (expr1) if (expr2) statement1; else statement2;
我们知道else
必须与第二 if
匹配,因此上述内容相当于:
if (expr1) { if (expr2) statement1; else statement2; }
但语法也与其他可能的解析相匹配,相当于:
if (expr1) { if (expr2) statement1; } else statement2;
这个问题有三种可能的解决方案:
什么都不做。 Bison在这里做了正确的事情,设计:它总是喜欢&#34;转移&#34;结束&#34;减少&#34;。这意味着,如果else
可以与开放的if
语句匹配,那么野牛将始终这样做,而不是保持else
以匹配某些外部if
语句。龙书中有很好的描述,以及其他地方。
这个解决方案的问题在于你仍然会收到关于转换/减少冲突的警告,而且很难区分&#34; OK&#34;冲突,新创造的&#34;不行&#34;冲突。 Bison提供了%expect
声明,因此您可以告诉它您预期会发生多少冲突,如果找到了正确的数字,将会取消警告,但这仍然非常脆弱。
使用优先级声明。这些在bison manual.中有描述,它们用于解决悬空的其他问题是该章中的一个运行示例。在你的情况下,它看起来像这样:
%precedence T_then /* Fake terminal, needed for %prec */
%precedence T_else
/* ... */
%%
/* ... */
entoli_if: T_if T_openpar geniki_ekfrasi Tw_closepar entoli T_else entoli
| T_if T_openpar geniki_ekfrasi T_closepar entoli %prec T_then
在这里,我已经删除了不必要的非终端else_clause
,因为它隐藏了else
令牌。如果您想保留它,无论出于何种原因,您需要在使用它的%prec T_else
制作的末尾添加entoli_if
。
%precedence
声明只能从bison 3.0开始提供。如果您有早期版本的bison,则可以使用%nonassoc
声明,但这可能会隐藏其他一些错误。
修复语法。实际上可以制作一个明确的语法,但它有点工作。
重点在于:
if (expr) statement1 else statement2
statement1
不能是无法匹配的if
语句。如果statement1
是if
语句,则必须包含else
条款;否则,外else
中的if
将与内if
匹配。并且递归地应用于statement1
中的任何尾随语句,例如
if (e2) statement2;
else if (e3) statement3
else /* must be present */ statement;
我们可以通过将陈述分为&#34;匹配&#34;来表达这一点。语句(所有if
与else
匹配)和&#34;不匹配&#34;陈述:(我还没有尝试在这里保留希腊非终端名称;对不起。你必须根据你的语法调整这个想法。)
statement: matching_statement | non_matching_statement ;
matching_statement: call_statement | assignment_statement | ...
| matching_if_statement
non_matching_statement: non_matching_if_statement
/* might be others, see below */
if_condition: "if" '(' expression ')' ;
matching_if_statement:
if_condition matching_statement "else" matching_statement ;
non_matching_if_statement:
if_condition statement
| if_condition matching_statement "else" non_matching_statement
;
在C中,还有其他复合语句可以以语句(while
,for
)结尾。这些中的每一个也都有一个匹配的&#34;和&#34;不匹配&#34;版本,取决于最终语句是匹配还是不匹配:
while_condition: "while" '(' expression ')' ;
matching_while_statement: while_condition matching_statement ;
non_matching_while_statement: while_condition non_matching_statement ;
据我所知,这不适用于您的语言,但您可能希望将来扩展它以包含此类声明。
Bison允许您使用单个字符标记作为自己,用单引号括起来。因此,您可以只编写T_openpar
,而不是声明'('
然后编写使用它的详细规则。你甚至不需要宣布它。 (在您的flex - 或其他 - 扫描仪中,您只需return '(';
而不是return T_openpar
,这就是您不需要声明令牌的原因。)这通常会使语法更具可读性
Bison还允许您为令牌指定一个人类可读的名称。 (此功能并非在所有yacc
衍生产品中,但它非常常见。),这也可以使语法更具可读性。例如,您可以为if
和else
令牌指定名称,如下所示:
%token T_if "if"
%token T_else "else"
然后你可以在你的语法规则中使用引用的字符串。 (我在上一个例子中就悬挂的其他问题做了这一点。)在弹性扫描仪中,你仍然需要使用标记符号T_if
和T_else
。
如果您有一个双符号标记,如&&
,通常情况下,如果扫描程序识别它并返回单个标记,而不是解析器识别两个连续的&
标记。在第二种情况下,解析器将识别:
boolean_expr1 & & boolean_expr2
好像已经写好了
boolean_expr1 && boolean_expr2
虽然第一个很可能是应报告的错误。
Bison是一个自下而上的LALR(1)解析器生成器。没有必要删除左递归。自下而上的解析器更喜欢左递归,左递归语法通常更准确,更容易阅读。例如,最好全面宣布:
apli_ekfrasi: aplos_oros
| apli_ekfrasi '+' aplos_oros
| apli_ekfrasi '-' aplos_oros;
而不是在你的语法中使用LL风格的重复后缀(loop7
)。左递归语法可以在不扩展解析器堆栈的情况下进行解析,并且更准确地表示表达式的语法结构,使得解析器操作更容易编写。
您的语法中还有许多其他地方可能需要重温。
(这个建议直接来自bison manual:&#34;你应该总是使用左递归,因为它可以解析具有有限堆栈空间的任意数量元素的序列。&#34;)