通过提升精神将语义动作附加到解析器

时间:2016-05-10 21:20:30

标签: c++ parsing boost boost-spirit boost-spirit-qi

我试图理解将语义动作“附加”到解析器的确切意味着什么,更确切地说,我想了解语义动作何时以及在何种持续时间与解析器绑定。

为此,我以下列方式稍微修改了boost spirit库的employee.cpp示例:

1°/添加了print()函数,其输出仅用于在调用时跟踪:

void print(const struct employee & e) { std::cout << e.surname << "\n"}

2°/在类employee_parser的构造函数的末尾,我将print()函数绑定到start解析器:

employee_parser() : employee_parser::base_type(start)
    {
        using qi::int_;
        using qi::lit;
        using qi::double_;
        using qi::lexeme;
        using ascii::char_;

        quoted_string %= lexeme['"' >> +(char_ - '"') >> '"'];

        start %=
            lit("employee")
            >> '{'
            >>  int_ >> ','
            >>  quoted_string >> ','
            >>  quoted_string >> ','
            >>  double_
            >>  '}'
            ;
        start[&print];
    }

虽然我已经将start解析器附加了语义操作print,但正如文档中所示,print()函数永远不会被调用。它接口语义操作需要附加在解析器定义的右端,因为解析器出现在同一个定义中的时间很多。任何人都能详细说明一下这个吗?

1 个答案:

答案 0 :(得分:2)

在精神上,解析器是一个函数对象,并且在大多数情况下,为了允许你创建新的解析器而重载的运算符,例如>>等,返回不同函数对象,而不是修改原始对象。

如果你曾经使用java并遇到过java的不可变字符串,你可以把它想象成这样。

当你有一个像

这样的表达式时
rule1 = lit("employee");
rule2 = (rule1 >> lit(",") >> rule1) [ &print ];

正在发生的是生成一个新的解析器对象并将其分配给变量rule2,并且该解析器对象附加了语义操作。

实际上,表达式中的每个运算符都有一个新的临时解析器对象。构造解析器时,开销只有一次,在解析时并不重要。

当你有

start[&print];

这就像生成一个立即丢弃的临时值。它对start变量中的值没有副作用。这就是为什么永远不会打印。

如果它不能以这种方式工作,那么制作语法可能要复杂得多。

当你在精神qi中定义语法时,通常定义基本上是在语法对象的构造函数中完成的。首先给出规则的原型,指定它们的类型,船长等。然后逐一构建规则。您必须确保在初始化之前不在另一个规则的定义中使用规则。但是在初始化之后,它几乎不会改变所涉及的语法。 (您可以修改调试信息之类的内容。)

如果所有规则在初始化后都可能发生变化,那么他们都必须互相更新有关更改的内容,这将更加复杂。

您可以想象通过让规则存储对彼此的引用而不是值来避免这种情况。但这意味着指针和动态分配,并且会更慢。精神的一部分是它是表达式模板 - 所有那些“指针解引用”应该在编译时得到解决,正如我所理解的那样。