从可选的解析器表达式的可变参数列表生成Spirit解析器表达式

时间:2013-04-23 19:02:40

标签: boost c++11 boost-spirit variadic-templates boost-fusion

我正在寻找实现variadic函数的最简单方法,它采用boost :: spirit :: qi规则列表并将列表扩展为格式表达式:rule1 | rule2 | rule3 | ....让我们假设规则不合成任何属性。非常感谢您的帮助。

#include <boost/config/warning_disable.hpp>
#include <boost/spirit/include/qi.hpp>
#include <string>
#include <iostream>
#include <boost/spirit/include/phoenix_operator.hpp>

namespace qi    = boost::spirit::qi;
namespace ph    = boost::phoenix;
namespace ascii = boost::spirit::ascii;
using boost::spirit::qi::phrase_parse;
using boost::spirit::qi::ascii::space;
using boost::spirit::iso8859_1::char_;

typedef qi::rule<std::string::const_iterator,ascii::space_type> mrule_t;
typedef qi::rule< std::string::const_iterator,std::string() >   wrule_t;

//How to deduce expandBitwise() return type ?

template<typename T>
T expandBitwise(T& t)
{
    return t.rule_;
}

template<typename T,typename ...Tail>
T expandBitwise(T& t,Tail& ...tail)
{
    return t.rule_ | expandBitwise(tail...);
}

struct TStruct
{
    mrule_t     rule_;
    template<typename T,typename R>
    TStruct( T& rVar,const std::string&name, R& rule ) :
        rule_( qi::lit( name ) >> rule[ ph::ref( rVar )=qi::_1 ] )
        {}
};

template<typename T,typename ...Tail>
void mparse(const std::string& line,T& t,Tail& ...tail)
{
    std::string::const_iterator f,l;

    f=line.begin();
    l=line.end();

    // I would like to expand the rules here ...
    //if(phrase_parse(f,l,expandBitwise(t,tail...),space ) && f==l)

    if( phrase_parse(f, l, t.rule_, space ) && f==l )
        std::cout<<"Parsed:"<<line<<std::endl;
    else
        std::cout<<"Syntax error:"<<line<<std::endl;
}

int main()
{
    wrule_t rword=+~space;

    std::string par1,par2,par3,par4;

    TStruct r1( par1,"-a", rword );
    TStruct r2( par2,"-b", rword );
    TStruct r3( par3,"-c", rword );
    TStruct r4( par4,"-d", rword );

    mparse("abc 8.81"   ,r1,r2,r3,r4);
    mparse("-a atoken"  ,r1,r2,r3,r4);
    mparse("-b btoken"  ,r1,r2,r3,r4);
    mparse("-c ctoken"  ,r1,r2,r3,r4);
    mparse("-d dtoken"  ,r1,r2,r3,r4);

    return 0;
}

2 个答案:

答案 0 :(得分:5)

  

感谢您的快速提示!我刚试过你的代码,除非我做错了什么......我得到了这个输出:Syntax error:abc 8.81 Parsed:-a atoken Syntax error:-b btoken Syntax error:-c ctoken Syntax error:-d dtoken - G. Civardi 2 hours ago

好的,所以,我不能不管它:/

原因是涉及未定义行为,因为解析器表达式被传递到expandBitwise并被复制的方式:Boost Proto表达式模板不是为了复制而设计的因为它们可能包含对临时工具的引用,临时工具的生命周期在包含完整表达式的末尾结束。

  

有关更多背景知识,请参阅Zero to 60 MPH in 2 seconds!

上的讨论

经过长时间({1}}和rule_.alias()调整后,我已经达到了以下解决方案(顺便说一下,根本不再需要帮助函数):

boost::proto::deepcopy

对UB的保护是template<typename ...Tail> void mparse(const std::string& line,Tail& ...tail) { auto parser = boost::fusion::fold( boost::tie(ph::bind(&TStruct::rule_, arg1)(tail)...), qi::eps(false), deepcopy_(arg2 | arg1) ); auto f=begin(line), l=end(line); if( qi::phrase_parse(f, l, parser, ascii::space ) ) std::cout << "Parsed:" << line << std::endl; else std::cout << "Syntax error:" << line << std::endl; if (f!=l) std::cout << "Remaining unparsed: '" << std::string(f,l) << "'\n"; } 调用,它是deepcopy_()的一个简单的多态可调用适配器:

boost::proto::deepcopy

使用此代码,请注意,输出变为:

struct DeepCopy
{
    template<typename E> struct result { typedef typename boost::proto::result_of::deep_copy<E>::type type; };

    template<typename E>
        typename result<E>::type
        operator()(E const& expr) const {
            return boost::proto::deep_copy(expr);
        }
};

static const ph::function<DeepCopy> deepcopy_;

作为奖励,代码现在允许您使用Spirit的内置debug()功能(取消注释该行):

Syntax error:abc 8.81
Remaining unparsed: 'abc 8.81'
Parsed:-a atoken
Parsed:-b btoken
Parsed:-c ctoken
Parsed:-d dtoken
Bye
  

使用

进行测试      
      
  • Boost 1_54_0
  •   
  • GCC 4.7.2,4.8.x,Clang 3.2
  •   
  • 请注意重要的<-d> <try>abc 8.81</try> <fail/> </-d> <-c> <try>abc 8.81</try> <fail/> </-c> <-b> <try>abc 8.81</try> <fail/> </-b> <-a> <try>abc 8.81</try> <fail/> </-a> Syntax error:abc 8.81 Remaining unparsed: 'abc 8.81'
  •   

完整代码

#define

答案 1 :(得分:2)

您不小心从expandBitwise帮助程序返回了TStruct类型。像这样修复它:

template<typename T>
auto expandBitwise(T const& t) -> decltype(t.rule_)
{
    return t.rule_;
}

template<typename T,typename ...Tail>
auto expandBitwise(T const& t,Tail const&... tail) -> decltype(t.rule_)
{
    return t.rule_ | expandBitwise(tail...);
}

如果要公开属性,则返回类型扣除规则将更加复杂。基本上,你正在做的是复制精神的EDSL部分。


让我们交换故事......

  

Clippy: 看起来您正在尝试编写命令行参数解析器。你想要帮忙吗?

通过创建新的Proto Domain并实际创建终端,可以更系统地为您的选项解析器实现DSL机制。这会以某种方式吸引我。

或者 您可以使用 Nabialek Trick 从另一个角度完全取消。这恰好是我几周前玩过的一种方法,我会与你分享我提出的设计:https://gist.github.com/sehe/2a556a8231606406fe36#file-test-cpp

重要的是,语法是“固定的”:

start    = -argument % '\0';
unparsed = as_string  [ +~nul ] [ std::cerr << phx::val("ignoring unparsed argument: '") << _1 << "'\n" ];
argument = ('-' >> +shortopt) | ("--" >> longopt) >> -unparsed | unparsed;

诀窍在于:

shortopt = shortNames [_a = _1] >> lazy(_a);
longopt  = longNames  [_a = _1] >> lazy(_a);

其中shortNameslongNamesqi::symbols解析器表,基于CliOptionsCliFlags的可变列表动态构建(我将它们传递为一个元组,因为我想将结果存储在CliOption结构中。)

qi::lazy(_a)调用存储在符号表中的解析器。

作为奖励,我的CliOptions解析器还具有生成“使用”信息的功能。解析表达式的构建器以及用法信息是可扩展的。

int main(int argc, char* argv[])
{
    using CliParsing::make_option;

    typedef std::string::const_iterator It;

    auto config = std::make_tuple(
        make_option('a', "absolutely", "absolutely"),
        make_option('b', "borked"    , "borked")    ,
        make_option('c', "completion", "completion"),
        make_option('d', "debug",      "turn on debugging"),
        make_option('e', "",           "no long name")  ,
        //make_option('f', "flungeons" , "flungeons") ,
        //make_option('g', "goofing"   , "")   ,
        //make_option('m', "monitor",    "monitoring level"),
        make_option('t', "testing"   , "testing flags"),
        make_option('\0',"file"      , "with a filename (no short name)"),

        make_option('y', "assume-yes", "always assume yes"),
        make_option('v', "verbose",    "increase verbosity level"),
        make_option('i', "increment",  "stepsize to increment with", 5)
        );

    CliParsing::OptionGrammar<It> parser(config);

    using namespace phx::arg_names;
    const auto cmdline = std::accumulate(argv+1, argv+argc, std::string(), arg1 + arg2 + '\0');

    bool ok = qi::parse(begin(cmdline), end(cmdline), parser);

    std::cout << "Parse success " << std::boolalpha << ok << "\n";
    std::cout << parser.getUsage();

    return ok? 0 : 255;
}

当使用一些随机参数-i 3 --completion -t --file=SOME.TXT -b huh?调用时,打印:

short form option --increment parsed
ignoring unparsed argument: '3'
long form switch --completion parsed
short form switch --testing parsed
long form switch --file parsed
ignoring unparsed argument: '=SOME.TXT'
short form switch --borked parsed
ignoring unparsed argument: 'huh?'

Parse success true
 --absolutely (-a)
    absolutely (flag)
 --borked (-b)
    borked (flag)
 --completion (-c)
    completion (flag)
 --debug (-d)
    turn on debugging (flag)
 -e
    no long name (flag)
 --testing (-t)
    testing flags (flag)
 --file
    with a filename (no short name) (flag)
 --assume-yes (-y)
    always assume yes (flag)
 --verbose (-v)
    increase verbosity level (flag)
 --increment (-i)
    stepsize to increment with (option with value; default '5')

如您所见,并非所有选项都已实施(特别是--标记选项列表的结尾)。