我正在用C语言编写一个编译器,我使用bison语法和flex来代替令牌。为了提高错误消息的质量,需要在语法中出现一些常见错误。然而,这有一个副作用,即野牛认为无效输入实际上是有效的。
例如,请考虑这个语法:
program
: command ';' program
| command ';'
| command {yyerror("Missing ;.");} // wrong input
;
command
: INC
| DEC
;
其中INC
和DEC
是令牌,program
是初始符号。在这种情况下,INC;
是有效的程序,但INC
不是,并且会生成错误消息。但是,函数yyparse()
返回0,就好像程序是正确的一样。
查看野牛手册,我找到了宏YYERROR
,其行为应该像解析器本身发现错误一样。但即使我在调用YYERROR
后添加yyerror()
,函数yyparse()
仍会返回0.我可以使用YYABORT
代替,但这会在第一个错误时停止,这很可怕而不是我想要的。
有没有让yyparse()
在没有停在第一个错误的情况下返回1?
答案 0 :(得分:3)
由于您打算从语法错误中恢复,因此您无法使用yyparse
中的返回码来表示发生了一个或多个错误。相反,您必须自己跟踪这些信息。
传统的方法是使用全局错误计数(只显示关键部分):
%{
int parse_error_count = 0;
%}
%%
program: statement { yyerror("Missing semicolon");
++parse_error_count; }
%%
int parse_interface() {
parse_error_count = 0;
int status = yyparse();
if (status) return status; /* Might have run out of memory */
if (parse_error_count) return 3; /* yyparse returns 0, 1 or 2 */
return 0;
}
更现代的解决方案是定义一个额外的" out"参数到yyparse:
%parse-param { int* error_count }
%%
program: statement { yyerror("Missing semicolon");
++*error_count; }
%%
int main() {
int error_count = 0;
int status = yyparse(&error_count);
if (status || error_count) { /* handle error */ }
最后,如果您真的需要从您的野牛生成的代码中导出符号yyparse
,您可以执行以下丑陋的黑客攻击:
%code top {
#define yyparse internal_yyparse
}
%parse-param { int* error_count }
%%
program: statement { yyerror("Missing semicolon");
++*error_count; }
%%
#undef yyparse
int yyparse() {
int error_count = 0;
int status = internal_yyparse(&error_count);
// Whatever you want to do as a summary
return status ? status : error_count ? 1 : 0;
}
答案 1 :(得分:1)
yyerror()
只打印一条错误消息。它并没有改变yyparse()
返回的内容。
你正在尝试的不是一个好主意。你将极大地扩展语法,并且存在使其模糊不清的重大风险。您需要做的就是删除调用yyerror()
的作品。无论如何,该输入将产生语法错误,这将导致yyparse()
不返回0.您正在养狗并咆哮自己。您应该检查的是解析器无法看到的语义错误。
如果您真的想要改进错误消息,那么解析表和状态信息中有足够的信息可以告诉您预期的下一个令牌是什么。然而,在大多数情况下,如此大的设置打印它是毫无意义的。但程序员习惯于整理出语法错误'。别出汗。编写编译器已经很难了。
注意:您应该使语法保持递归,以避免过多的堆栈使用:例如,program : program ';' command
。