如何用re2c匹配空格和注释

时间:2019-05-14 22:53:19

标签: parsing lexical-analysis re2c

我最近开始使用bison来编写小型编译器练习。我在使用空格和评论时遇到了一些问题。我正在尝试调试问题,然后到达this source,看上去像我要找的东西。我尝试按照建议更改和删除一些字符,但是没有用。 同样在编译过程中,我遇到以下错误:re2c: error: line 2963, column 0: can only difference char sets。 在代码的下面:

yy::conj_parser::symbol_type yy::yylex(lexcontext& ctx)
{
        const char* anchor = ctx.cursor;
        ctx.loc.step();
        // Add a lambda function to avoid repetition
        auto s = [&](auto func, auto&&... params) { ctx.loc.columns(ctx.cursor - anchor); return func(params..., ctx.loc); };

%{  /* Begin re2c lexer : Tokenization process starts */

re2c:yyfill:enable    = 0;
re2c:define:YYCTYPE   = "char";
re2c:define:YYCURSOR  = "ctx.cursor";

"return"          { return s(conj_parser::make_RETURN); }
"while" | "for"   { return s(conj_parser::make_WHILE);  }
"var"             { return s(conj_parser::make_VAR);    }
"if"              { return s(conj_parser::make_IF);     }

// Identifiers
[a-zA-Z_] [a-zA-Z_0-9]*  { return s(conj_parser::make_IDENTIFIER, std::string(anchor, ctx.cursor)); }

// String and integers:
"\""" [^\"]* "\""      { return s(conj_parser::make_STRINGCONST, std::string(anchor+1, ctx.cursor-1)); }
[0-9]+                 { return s(conj_parser::make_NUMCONST, std::stol(std::string(anchor, ctx.cursor))); }

// Whitespace and comments:
"\000"               { return s(conj_parser::make_END);      }
"\r\n" | [\r\n]      { ctx.loc.lines();   return yylex(ctx); }
"//" [^\r\n]*        {                    return yylex(ctx); }
[\t\v\b\f ]          { ctx.loc.columns(); return yylex(ctx); }

非常感谢您指出正确的方向或为解决此错误的原因加了一些阴影。

1 个答案:

答案 0 :(得分:1)

您真的应该提到哪一行是2963行。也许在这里,因为该行中似乎还有一个引号。

"\""" [^\"]* "\""
    ^