使用语义操作解析以逗号分隔的范围和数字列表

时间:2016-01-04 20:44:10

标签: c++ parsing boost c++14 boost-spirit-x3

使用Boost.Spirit X3,我想将逗号分隔的范围列表和单个数字(例如1-4,6,7,9-12)解析为单个std::vector<int>。以下是我的想法:

namespace ast {
    struct range 
    {
        int first_, last_;    
    };    

    using expr = std::vector<int>;    
}

namespace parser {        
    template<typename T>
    auto as_rule = [](auto p) { return x3::rule<struct _, T>{} = x3::as_parser(p); };

    auto const push = [](auto& ctx) { 
        x3::_val(ctx).push_back(x3::_attr(ctx)); 
    };  

    auto const expand = [](auto& ctx) { 
        for (auto i = x3::_attr(ctx).first_; i <= x3::_attr(ctx).last_; ++i) 
            x3::_val(ctx).push_back(i);  
    }; 

    auto const number = x3::uint_;
    auto const range  = as_rule<ast::range> (number >> '-' >> number                   ); 
    auto const expr   = as_rule<ast::expr>  ( -(range [expand] | number [push] ) % ',' );
} 

给出输入

    "1,2,3,4,6,7,9,10,11,12",   // individually enumerated
    "1-4,6-7,9-12",             // short-hand: using three ranges

已成功解析为( Live On Coliru ):

OK! Parsed: 1, 2, 3, 4, 6, 7, 9, 10, 11, 12, 
OK! Parsed: 1, 2, 3, 4, 6, 7, 9, 10, 11, 12, 

问题:我认为我理解将语义操作expand应用于range部分是必要的,但为什么我还必须应用语义操作{{ 1}}到push部分?没有它(即对number使用简单的( -(range [expand] | number) % ',')规则,单个数字不会传播到AST中( Live On Coliru ):

expr

奖金问题:我是否甚至需要语义操作才能做到这一点? Spirit X3文档似乎不鼓励他们。

1 个答案:

答案 0 :(得分:3)

语义动作的常见问题解答禁止自动属性传播。假设语义行为将代替它。

一般来说,有两种方法:

  • 使用operator%=代替operator=将定义分配给规则

  • 或使用rule<>模板的第三个(可选)模板参数,可以将其指定为true以强制自动传播语义。

简化样本

在这里,我主要通过删除范围规则本身内的语义动作来简化。现在,我们可以完全删除ast::range类型。没有更多的融合适应。

相反,我们使用&#34;自然&#34; numer>>'-'>>number的合成属性,是整数的融合序列(在这种情况下为fusion::deque<int, int>)。

现在,所有剩下的工作就是确保|的分支产生兼容的类型。一个简单的repeat(1)[]修复了这个问题。

<强> Live On Coliru

#include <boost/spirit/home/x3.hpp>
#include <iostream>

namespace x3 = boost::spirit::x3;

namespace ast {
    using expr = std::vector<int>;    

    struct printer {
        std::ostream& out;

        auto operator()(expr const& e) const {
            std::copy(std::begin(e), std::end(e), std::ostream_iterator<expr::value_type>(out, ", "));;
        }
    };    
}

namespace parser {        
    auto const expand = [](auto& ctx) { 
        using boost::fusion::at_c;

        for (auto i = at_c<0>(_attr(ctx)); i <= at_c<1>(_attr(ctx)); ++i) 
            x3::_val(ctx).push_back(i);  
    }; 

    auto const number = x3::uint_;
    auto const range  = x3::rule<struct _r, ast::expr> {} = (number >> '-' >> number) [expand]; 
    auto const expr   = x3::rule<struct _e, ast::expr> {} = -(range | x3::repeat(1)[number]  ) % ',';
} 

template<class Phrase, class Grammar, class Skipper, class AST, class Printer>
auto test(Phrase const& phrase, Grammar const& grammar, Skipper const& skipper, AST& data, Printer const& print)
{
    auto first = phrase.begin();
    auto last = phrase.end();
    auto& out = print.out;

    auto const ok = phrase_parse(first, last, grammar, skipper, data);
    if (ok) {
        out << "OK! Parsed: "; print(data); out << "\n";
    } else {
        out << "Parse failed:\n";
        out << "\t on input: " << phrase << "\n";
    }
    if (first != last)
        out << "\t Remaining unparsed: '" << std::string(first, last) << '\n';    
}

int main() {
    std::string numeric_tests[] =
    {
        "1,2,3,4,6,7,9,10,11,12",   // individually enumerated
        "1-4,6-7,9-12",             // short-hand: using three ranges
    };

    for (auto const& t : numeric_tests) {
        ast::expr numeric_data;
        test(t, parser::expr, x3::space, numeric_data, ast::printer{std::cout});
    }
}

打印:

OK! Parsed: 1, 2, 3, 4, 6, 7, 9, 10, 11, 12, 
OK! Parsed: 1, 2, 3, 4, 6, 7, 9, 10, 11, 12,