你如何在Jison中匹配零个或多个令牌?

时间:2013-04-04 04:12:30

标签: javascript parsing parser-generator bnf jison

我正在Jison中编写一个简单的表达式解析器,允许任意数量的换行符跟在表达式中的二元运算符。到目前为止,这是我的语法:

{
    "operators": [
        ["left", "+", "-"],
        ["left", "*", "/", "%"]
    ],
    "bnf": {
        "program": [
            ["statement EOF", "return $1;"]
        ],
        "statement": [
            ["expression newlines", "$$ = $1 + ';';"]
        ],
        "expression": [
            ["NUMBER",                           "$$ = yytext;"],
            ["expression + expression",          "$$ = $1 + ' + ' + $3;"],
            ["expression - expression",          "$$ = $1 + ' - ' + $3;"],
            ["expression * expression",          "$$ = $1 + ' * ' + $3;"],
            ["expression / expression",          "$$ = $1 + ' / ' + $3;"],
            ["expression % expression",          "$$ = $1 + ' % ' + $3;"],
            ["expression + newlines expression", "$$ = $1 + ' + ' + $4;"],
            ["expression - newlines expression", "$$ = $1 + ' - ' + $4;"],
            ["expression * newlines expression", "$$ = $1 + ' * ' + $4;"],
            ["expression / newlines expression", "$$ = $1 + ' / ' + $4;"],
            ["expression % newlines expression", "$$ = $1 + ' % ' + $4;"]
        ],
        "newlines": [
            ["NEWLINE",          ""],
            ["newlines NEWLINE", ""]
        ]
    }
}

正如您所看到的,我正在为每个二元运算符编写两条规则。在我看来,这是多余的。我希望有一个匹配零个或多个NEWLINE令牌(Kleene star)而不是一个或多个令牌(Kleene plus)的产品。你怎么在Jison做这个?

1 个答案:

答案 0 :(得分:1)

我使用Jison而忽略了空格(包括换行符)。

我的%lex中的第一行是:

\s+   /* ignore */

但如果你不愿意,你不必这样做。 尝试以下几点:

"expression": [
            ["NUMBER",                           "$$ = yytext;"],
            ["expression + expression",          "$$ = $1 + ' + ' + $3;"],
            ["expression - expression",          "$$ = $1 + ' - ' + $3;"],
            ["expression * expression",          "$$ = $1 + ' * ' + $3;"],
            ["expression / expression",          "$$ = $1 + ' / ' + $3;"],
            ["expression % expression",          "$$ = $1 + ' % ' + $3;"],
            ["expression newlines",              "$$ = $1"],
            ["newlines expression",              "$$ = $2"]
        ],

这应该允许任何表达式之前/之后的任何数量的新行。