Question

所以我有一个解析器，它将7.5*[someAlphanumStr]或7.5[someAlphanumStr]之类的字符串解析为这个结构：

struct summand {
    float factor;
    std::string name;
    summand(const float & f):factor(f), name(""){}
    summand(const std::string & n):factor(1.0f), name(n){}
    summand(const float & f, const std::string & n):factor(f), name(n){}
    summand():factor(0.0f), name(""){}
};

但另外我需要能够解析[someAlphanumStr]*7.4，[someAlphanumStr]5，7.4和[someAlphanumStr]等字符串。在最后两种情况下（7.4和[someAlphanumStr]）我想为省略的字段设置默认值的值，为此我已经为我的struct summand构造函数编写了一个参数

以下是我生成的代码和结果：

#include <boost/config/warning_disable.hpp>
#include <boost/spirit/include/qi.hpp>
#include <boost/fusion/include/adapt_struct.hpp>
#include <boost/fusion/include/io.hpp>

#include <iostream>
#include <string>
#include <vector>

namespace client
{
    namespace spirit = boost::spirit;
    namespace qi     = boost::spirit::qi;
    namespace ascii  = boost::spirit::ascii;

    struct summand {
        float factor;
        std::string name;
        summand(const float & f):factor(f), name(""){}
        summand(const std::string & n):factor(1.0f), name(n){}
        summand(const float & f, const std::string & n):factor(f), name(n){}
        summand():factor(0.0f), name(""){}
    };
}

BOOST_FUSION_ADAPT_STRUCT(client::summand,
                      (float, factor)
                      (std::string, name)
                      )

namespace client {

    template <typename Iterator>
    struct summand_parser : qi::grammar<Iterator, summand(), ascii::space_type>
    {
        summand_parser() : summand_parser::base_type(summand_rule)
        {
            using namespace ascii;

            summand_rule %= (qi::float_ >> -qi::lit('*') >> '[' >> qi::lexeme[alpha >> *alnum] >> ']')|('[' >> qi::lexeme[alpha >> *alnum] >> ']' >> -qi::lit('*') >> qi::float_)|(qi::float_)|('[' >> qi::lexeme[alpha >> *alnum] >> ']');

        }

        qi::rule<Iterator, summand(), ascii::space_type> summand_rule;
    };
}

void parseSummandsInto(std::string const& str, client::summand& summands)
{
    typedef std::string::const_iterator It;
    static const client::summand_parser<It> g;

    It iter = str.begin(),
    end = str.end();

    bool r = phrase_parse(iter, end, g, boost::spirit::ascii::space, summands);

    if (r && iter == end)
        return;
    else
        throw "Parse failed";
}

int main()
{
    std::vector<std::string> inputStrings = {"7.5*[someAlphanumStr]", "7.5[someAlphanumStr]", "[someAlphanumStr]*7.4", "[someAlphanumStr]5", "7.4", "[someAlphanumStr]"};

    std::for_each(inputStrings.begin(), inputStrings.end(), [&inputStrings](std::string & inputStr) {
        client::summand parsed;
        parseSummandsInto(inputStr, parsed);
        std::cout << inputStr << " -> " << boost::fusion::as_vector(parsed) << std::endl;
    });
}

结果（Coliru）：

+ clang++ -std=c++11 -O0 -Wall -pedantic main.cpp
+ ./a.out
+ c++filt -t
7.5*[someAlphanumStr] -> (7.5 someAlphanumStr)
7.5[someAlphanumStr] -> (7.5 someAlphanumStr)
[someAlphanumStr]*7.4 -> (115 )
[someAlphanumStr]5 -> (115 )
7.4 -> (7.4 )
[someAlphanumStr] -> (115 omeAlphanumStr)

感谢所有人提供明确的答案和建议，尤其感谢@sehe。

Answer 1

使用Spirit ^[1]完成任何的方法是使用小步骤，在此过程中严格简化。

不要忍受＆＃34; cruft＆＃34; （比如，随机重复的子表达式）。而且，明确是好的。在这种情况下，我首先提取重复的子表达式并重新格式化以便易读：

    name_rule   = '[' >> qi::lexeme[alpha >> *alnum] >> ']';
    factor_rule = qi::float_;

    summand_rule %= 
          (factor_rule >> -qi::lit('*') >> name_rule)
        | (name_rule   >> -qi::lit('*') >> factor_rule)
        | (factor_rule)
        | (name_rule)
        ;

在那里，已经好多了，而且我还没有改变一件事。可是等等！它不再编译

    qi::rule<Iterator, std::string(), ascii::space_type> name_rule;
    qi::rule<Iterator, float(),       ascii::space_type> factor_rule;

事实证明，语法只发生了＃34;编译，因为Spirit的属性兼容性规则是如此宽松/宽松，以至于匹配名称的字符只被分配给因子部分（115来自的地方：0x73是ASCII来自s的{{1}}。

OOPS / TL; DW 我在这里写了一篇很长的分析，一次，但我通过关闭浏览器来破坏它，所以只有一个旧的草案缓存服务器端:(我＆＃ 39;现在把它煮到底线：

指南使用构造函数重载分配给您的公开属性类型，或使用Fusion序列调整，但不要混用两者：他们会以惊人/恼人的方式干涉。

不用担心，当然，我不会让你空手而归。我只是手动＆＃39;将someAlphanumStr和factor组件引导到各自的“插槽”中。（成员）^{的 [2]}

继承属性是保持这种清晰易用的好方法：

name

只需在语义操作中添加一个简单的赋值：

// assuming the above rules redefined to take ("inherit") a summand& attribute: qi::rule<Iterator, void(summand&), ascii::space_type> name_rule, factor_rule;

现在，魔法尘埃＆＃39;当然是如何定义name_rule = as_string [ '[' >> lexeme[alpha >> *alnum] >> ']' ] [ _name = _1 ]; factor_rule = double_ [ _factor = _1 ];和_name演员。由于维护成本的原因，我更喜欢使用绑定_factor：

phx::at_c<N>

请参阅？这非常简洁，清楚地显示了正在发生的事情。此外，这里没有实际需要对static const auto _factor = phx::bind(&summand::factor, qi::_r1); static const auto _name = phx::bind(&summand::name, qi::_r1);进行Fusion适配。

现在，最后，我们也可以简化主要规则：

summand

这样做，只需通过使尾随部分可选而将单分支分支组合成双分支分支。

注意summand_rule = factor_rule (_val) >> - ( -lit('*') >> name_rule (_val) ) | name_rule (_val) >> - ( -lit('*') >> factor_rule (_val) ) ;默认构造函数如何处理默认值：

summand

请注意这在一定程度上消除了一些复杂性。

查看运行 Live on Coliru 的完全适应的示例，其中打印：

struct summand { float factor; std::string name; summand() : factor(1.f), name("") {} };

完整代码清单

7.5*[someAlphanumStr] -> (7.5 someAlphanumStr) 7.5[someAlphanumStr] -> (7.5 someAlphanumStr) [someAlphanumStr]*7.4 -> (7.4 someAlphanumStr) [someAlphanumStr]5 -> (5 someAlphanumStr) 7.4 -> (7.4 ) [someAlphanumStr] -> (1 someAlphanumStr)

^[1]可以说，技术上的其他任何东西

^[2]您可以保留FUSION_ADAPT_STRUCT，但它不再是必需，如您所见

Answer 2

我不确定这是否是最好的解决方案，但是我会通过提供融合序列的初始值来解决这个问题，而不是稍后用Phoenix修改它们：

summand_rule %=
    (qi::float_ >> -(-qi::lit('*') >> '[' >> qi::lexeme[alpha >> *alnum] >> ']'))
  | (qi::attr(0.) >> '[' >> qi::lexeme[alpha >> *alnum] >> ']' >> -(-qi::lit('*') >> qi::float_[ph::at_c<0>(qi::_val) = qi::_1]));

也就是说，我们给融合序列中的第一个项目初始值0.，它被分配给factor，然后返回并稍后修改它。

如果我们omit相反的情况中的因素，规则的属性类型将完全模拟summand，我们可以使用=分配而不是%=：< / p>

summand_rule =
    (qi::float_ >> -(-qi::lit('*') >> '[' >> qi::lexeme[alpha >> *alnum] >> ']'))
  | (qi::attr(0.) >> '[' >> qi::lexeme[alpha >> *alnum] >> ']' >> -(-qi::lit('*') >> qi::omit[qi::float_[ph::at_c<0>(qi::_val) = qi::_1]]));

演示：http://coliru.stacked-crooked.com/a/46e3e8101a9c10ea

当某些结构字段被省略或与结构声明中的顺序不一样时，如何实现正确的解析？

2 个答案:

完整代码清单