所以我有一个解析器,它将7.5*[someAlphanumStr]
或7.5[someAlphanumStr]
之类的字符串解析为这个结构:
struct summand {
float factor;
std::string name;
summand(const float & f):factor(f), name(""){}
summand(const std::string & n):factor(1.0f), name(n){}
summand(const float & f, const std::string & n):factor(f), name(n){}
summand():factor(0.0f), name(""){}
};
但另外我需要能够解析[someAlphanumStr]*7.4
,[someAlphanumStr]5
,7.4
和[someAlphanumStr]
等字符串。在最后两种情况下(7.4
和[someAlphanumStr]
)我想为省略的字段设置默认值的值,为此我已经为我的struct summand
构造函数编写了一个参数
以下是我生成的代码和结果:
#include <boost/config/warning_disable.hpp>
#include <boost/spirit/include/qi.hpp>
#include <boost/fusion/include/adapt_struct.hpp>
#include <boost/fusion/include/io.hpp>
#include <iostream>
#include <string>
#include <vector>
namespace client
{
namespace spirit = boost::spirit;
namespace qi = boost::spirit::qi;
namespace ascii = boost::spirit::ascii;
struct summand {
float factor;
std::string name;
summand(const float & f):factor(f), name(""){}
summand(const std::string & n):factor(1.0f), name(n){}
summand(const float & f, const std::string & n):factor(f), name(n){}
summand():factor(0.0f), name(""){}
};
}
BOOST_FUSION_ADAPT_STRUCT(client::summand,
(float, factor)
(std::string, name)
)
namespace client {
template <typename Iterator>
struct summand_parser : qi::grammar<Iterator, summand(), ascii::space_type>
{
summand_parser() : summand_parser::base_type(summand_rule)
{
using namespace ascii;
summand_rule %= (qi::float_ >> -qi::lit('*') >> '[' >> qi::lexeme[alpha >> *alnum] >> ']')|('[' >> qi::lexeme[alpha >> *alnum] >> ']' >> -qi::lit('*') >> qi::float_)|(qi::float_)|('[' >> qi::lexeme[alpha >> *alnum] >> ']');
}
qi::rule<Iterator, summand(), ascii::space_type> summand_rule;
};
}
void parseSummandsInto(std::string const& str, client::summand& summands)
{
typedef std::string::const_iterator It;
static const client::summand_parser<It> g;
It iter = str.begin(),
end = str.end();
bool r = phrase_parse(iter, end, g, boost::spirit::ascii::space, summands);
if (r && iter == end)
return;
else
throw "Parse failed";
}
int main()
{
std::vector<std::string> inputStrings = {"7.5*[someAlphanumStr]", "7.5[someAlphanumStr]", "[someAlphanumStr]*7.4", "[someAlphanumStr]5", "7.4", "[someAlphanumStr]"};
std::for_each(inputStrings.begin(), inputStrings.end(), [&inputStrings](std::string & inputStr) {
client::summand parsed;
parseSummandsInto(inputStr, parsed);
std::cout << inputStr << " -> " << boost::fusion::as_vector(parsed) << std::endl;
});
}
结果(Coliru):
+ clang++ -std=c++11 -O0 -Wall -pedantic main.cpp
+ ./a.out
+ c++filt -t
7.5*[someAlphanumStr] -> (7.5 someAlphanumStr)
7.5[someAlphanumStr] -> (7.5 someAlphanumStr)
[someAlphanumStr]*7.4 -> (115 )
[someAlphanumStr]5 -> (115 )
7.4 -> (7.4 )
[someAlphanumStr] -> (115 omeAlphanumStr)
感谢所有人提供明确的答案和建议,尤其感谢@sehe。
答案 0 :(得分:3)
使用Spirit [1] 完成任何的方法是使用小步骤,在此过程中严格简化。
不要忍受&#34; cruft&#34; (比如,随机重复的子表达式)。而且,明确是好的。在这种情况下,我首先提取重复的子表达式并重新格式化以便易读:
name_rule = '[' >> qi::lexeme[alpha >> *alnum] >> ']';
factor_rule = qi::float_;
summand_rule %=
(factor_rule >> -qi::lit('*') >> name_rule)
| (name_rule >> -qi::lit('*') >> factor_rule)
| (factor_rule)
| (name_rule)
;
在那里,已经好多了,而且我还没有改变一件事。可是等等!它不再编译
qi::rule<Iterator, std::string(), ascii::space_type> name_rule;
qi::rule<Iterator, float(), ascii::space_type> factor_rule;
事实证明,语法只发生了#34;编译,因为Spirit的属性兼容性规则是如此宽松/宽松,以至于匹配名称的字符只被分配给因子部分(115
来自的地方:0x73是ASCII来自s
的{{1}}。
OOPS / TL; DW 我在这里写了一篇很长的分析,一次,但我通过关闭浏览器来破坏它,所以只有一个旧的草案缓存服务器端:(我&# 39;现在把它煮到底线:
不用担心,当然,我不会让你空手而归。我只是手动&#39;将指南使用构造函数重载分配给您的公开属性类型, 或 使用Fusion序列调整,但不要混用两者:他们会以惊人/恼人的方式干涉。
someAlphanumStr
和factor
组件引导到各自的“插槽”中。 (成员)的 [2] 强>
继承属性是保持这种清晰易用的好方法:
name
只需在语义操作中添加一个简单的赋值:
// assuming the above rules redefined to take ("inherit") a summand& attribute:
qi::rule<Iterator, void(summand&), ascii::space_type> name_rule, factor_rule;
现在,魔法尘埃&#39;当然是如何定义name_rule = as_string [ '[' >> lexeme[alpha >> *alnum] >> ']' ]
[ _name = _1 ];
factor_rule = double_ [ _factor = _1 ];
和_name
演员。由于维护成本的原因,我更喜欢使用绑定_factor
:
phx::at_c<N>
请参阅?这非常简洁,清楚地显示了正在发生的事情。此外,这里没有实际需要对static const auto _factor = phx::bind(&summand::factor, qi::_r1);
static const auto _name = phx::bind(&summand::name, qi::_r1);
进行Fusion适配。
现在,最后,我们也可以简化主要规则:
summand
这样做,只需通过使尾随部分可选而将单分支分支组合成双分支分支。
注意 summand_rule =
factor_rule (_val) >> - ( -lit('*') >> name_rule (_val) )
| name_rule (_val) >> - ( -lit('*') >> factor_rule (_val) )
;
默认构造函数如何处理默认值:
summand
请注意这在一定程度上消除了一些复杂性。
查看运行 Live on Coliru 的完全适应的示例,其中打印:
struct summand {
float factor;
std::string name;
summand() : factor(1.f), name("") {}
};
7.5*[someAlphanumStr] -> (7.5 someAlphanumStr)
7.5[someAlphanumStr] -> (7.5 someAlphanumStr)
[someAlphanumStr]*7.4 -> (7.4 someAlphanumStr)
[someAlphanumStr]5 -> (5 someAlphanumStr)
7.4 -> (7.4 )
[someAlphanumStr] -> (1 someAlphanumStr)
[1] 可以说,技术上的其他任何东西
[2] 您可以保留FUSION_ADAPT_STRUCT,但它不再是必需,如您所见
答案 1 :(得分:2)
我不确定这是否是最好的解决方案,但是我会通过提供融合序列的初始值来解决这个问题,而不是稍后用Phoenix修改它们:
summand_rule %=
(qi::float_ >> -(-qi::lit('*') >> '[' >> qi::lexeme[alpha >> *alnum] >> ']'))
| (qi::attr(0.) >> '[' >> qi::lexeme[alpha >> *alnum] >> ']' >> -(-qi::lit('*') >> qi::float_[ph::at_c<0>(qi::_val) = qi::_1]));
也就是说,我们给融合序列中的第一个项目初始值0.
,它被分配给factor
,然后返回并稍后修改它。
如果我们omit
相反的情况中的因素,规则的属性类型将完全模拟summand
,我们可以使用=
分配而不是%=
:< / p>
summand_rule =
(qi::float_ >> -(-qi::lit('*') >> '[' >> qi::lexeme[alpha >> *alnum] >> ']'))
| (qi::attr(0.) >> '[' >> qi::lexeme[alpha >> *alnum] >> ']' >> -(-qi::lit('*') >> qi::omit[qi::float_[ph::at_c<0>(qi::_val) = qi::_1]]));