我尝试编写编译器,并使用flex / bison进行扫描和解析。 我的问题是关于这两个如何通信,以便lex传递一个令牌类型,并且(如果需要)一个语义值。
问题在于我找到了不同的(冲突的?)文档。
例如here他们提到使用yylval子字段作为语义值,并返回令牌类型(可能是整数)。
[0-9]+ {
yylval->build<int> () = text_to_int (yytext);
return yy::parser::token::INTEGER;
}
[a-z]+ {
yylval->build<std::string> () = yytext;
return yy::parser::token::IDENTIFIER;
}
但是,我看到(也在官方文档中)this:
"-" return yy::calcxx_parser::make_MINUS (loc);
"+" return yy::calcxx_parser::make_PLUS (loc);
"*" return yy::calcxx_parser::make_STAR (loc);
"/" return yy::calcxx_parser::make_SLASH (loc);
"(" return yy::calcxx_parser::make_LPAREN (loc);
")" return yy::calcxx_parser::make_RPAREN (loc);
":=" return yy::calcxx_parser::make_ASSIGN (loc);
{int} {
errno = 0;
long n = strtol (yytext, NULL, 10);
if (! (INT_MIN <= n && n <= INT_MAX && errno != ERANGE))
driver.error (loc, "integer is out of range");
return yy::calcxx_parser::make_NUMBER (n, loc);
}
{id} return yy::calcxx_parser::make_IDENTIFIER (yytext, loc);
. driver.error (loc, "invalid character");
<<EOF>> return yy::calcxx_parser::make_END (loc);
在这里,根本没有提到yylval,我们返回的是一些奇怪的make _ ???函数,我无法理解它们的定义位置,它们接受的参数以及它们返回的内容。
有人可以向我澄清这两种方法之间的区别,如果我应该使用第二种方法,那么对这些神秘的方法做一个简短的解释_ ???方法
提前致谢!
答案 0 :(得分:1)
您链接到的文档部分是描述替代 API的两个部分中的第一部分。最好从beginning开始阅读,其中解释说:
yylex的实际界面取决于您是使用联合还是变种。
您引用的示例使用变体,因此使用complete symbols接口,其中定义了make_*
方法。 (这些不是标准库或Boost变体;它们是由bison框架定义的简单区分联合类。)
您使用哪种API完全取决于您;它们都有优点和缺点。
还有第三种选择:使用C接口构建解析器和词法分析器。这并不能阻止您使用C ++数据类型,但是您无法将它们直接放入解析器堆栈中;你需要使用指针,这使内存管理更加手动。 (实际上,还有两种不同的C API:传统的API,其中解析器在需要令牌时自动调用扫描器,以及&#34; push&#34;接口,其中扫描器调用解析器令牌。)