Boost :: Spirit简单的语法示例

时间:2012-02-07 11:54:32

标签: c++ parsing boost boost-spirit boost-spirit-qi

我正在阅读Boost Spirit(和Boost Fusion)教程(版本1.48.0)。我一直在玩玩具员工的例子。链接到源:

http://www.boost.org/doc/libs/1_48_0/libs/spirit/example/qi/employee.cpp

以下是示例的语法:

employee_parser() : employee_parser::base_type(start)
    {
        using qi::int_;
        using qi::lit;
        using qi::double_;
        using qi::lexeme;
        using ascii::char_;

        quoted_string %= lexeme['"' >> +(char_ - '"') >> '"'];

        start %=
            lit("employee")
            >> '{'
            >>  int_ >> ','
            >>  quoted_string >> ','
            >>  quoted_string >> ','
            >>  double_
            >>  '}'
            ;
    }

    qi::rule<Iterator, std::string(), ascii::space_type> quoted_string;
    qi::rule<Iterator, employee(), ascii::space_type> start;

我的修改删除了引号的处理,只解析分隔符之间的任何字符,并将其分配给解析器映射到的结构。

        //quoted_string %= lexeme['"' >> +(char_ - '"') >> '"'];
        start %=
            lit("employee")
            >> '{'
            >>  int_ >> ','
            >>  +(char_) >> ','
            >>  +(char_) >> ','
            >>  double_
            >>  '}'
            ;

我的假设是char_包括所有字符,直到达到逗号。但是,使用以下字符串进行编译和运行会导致无法解析。

./employee
employee{10,my,name,20.0}
-------------------------
Parsing failed
-------------------------

我也试图编写一个类似的解析器来自动转换为我的struct类型的相应类型。我确定我在为上面的输入字符串定义正确的语法时遗漏了一些根本错误的东西,所以非常感谢任何帮助!

谢谢!

1 个答案:

答案 0 :(得分:10)

+(char_)会占用一个或多个字符,因此它也会使用逗号,并且永远不会移至>> ','。这很贪心。

您应该使用差异运算符+(char_ - ',')编写-

//...
>>  int_ >> ','     
>>  +(char_ - ',') >> ','     
>>  +(char_ - ',') >> ','     
>>  double_
//...

解析器+(char_ - ',')将消耗每个字符,直到达到逗号。之后,它将移至>> ',',消费它,然后继续下一行+(char_ - ','),直到逗号等等。

有关此运算符的更多信息,请访问:http://www.boost.org/doc/libs/1_48_0/libs/spirit/doc/html/spirit/qi/reference/operator/difference.html

如果你想解析只包含字母的名字,你也可以考虑编写只接受字母的解析器:

//...
>>  int_ >> ','     
>>  +(char_("a-zA-Z")) >> ','     
>>  +(char_("a-zA-Z")) >> ','     
>>  double_
//...