到目前为止,我正在努力为javascript标识符编写一个解析器,这就是我所拥有的:
// All this rules have string as attribute.
identifier_ = identifier_start
>>
*(
identifier_part >> -(qi::char_(".") > identifier_part)
)
;
identifier_part = +(qi::alnum | qi::char_("_"));
identifier_start = qi::char_("a-zA-Z$_");
此解析器适用于我的测试中的“好标识符”列表:
"x__",
"__xyz",
"_",
"$",
"foo4_.bar_3",
"$foo.bar",
"$foo",
"_foo_bar.foo",
"_foo____bar.foo"
但是我遇到了一个错误的标识符问题:foo$bar
。这应该是失败的,但它成功了!! sintetized属性的值为"foo"
。
以下是foo$bar
的调试输出:
<identifier_>
<try>foo$bar</try>
<identifier_start>
<try>foo$bar</try>
<success>oo$bar</success>
<attributes>[[f]]</attributes>
</identifier_start>
<identifier_part>
<try>oo$bar</try>
<success>$bar</success>
<attributes>[[f, o, o]]</attributes>
</identifier_part>
<identifier_part>
<try>$bar</try>
<fail/>
</identifier_part>
<success>$bar</success>
<attributes>[[f, o, o]]</attributes>
</identifier_>
我想要的是解析器在解析foo$bar
时失败但在解析$foobar
时失败。
我缺少什么?
答案 0 :(得分:2)
您不需要解析器需要使用所有输入。
当规则在$
符号之前停止匹配时,它会成功返回,因为没有任何内容表示它不能跟$
符号后面。所以,你想声明它后面没有一个可能是标识符一部分的字符:
identifier_ = identifier_start
>>
*(
identifier_part >> -(qi::char_(".") > identifier_part)
) >> !identifier_start
;
来自Qi存储库的相关指令distinct
:http://www.boost.org/doc/libs/1_55_0/libs/spirit/repository/doc/html/spirit_repository/qi_components/directives/distinct.html