在Boost Spirit x3解析结果中包含前导零

时间:2019-04-06 20:22:27

标签: c++ boost boost-spirit

我想知道在使用boost Spirit X3解析数字时是否可以保留前导零。我目前有一个程序(基于员工样本),该程序将整数解析为我的数据结构。但是,在解析期间,我丢失了前导零。对于我的应用程序域,这是一个问题,其中任何整数前面的前导零给出不同的解释。

  #include <boost/spirit/home/x3.hpp>
  #include <boost/spirit/include/support_istream_iterator.hpp>
  #include <boost/fusion/adapted/struct.hpp>
  #include <iostream>

  namespace client {
    namespace ast {
        struct number
        {
            int number;
        };
    }
  }
  BOOST_FUSION_ADAPT_STRUCT(client::ast::number, number)

  namespace client
  {
    namespace parser
    {
        namespace x3 = boost::spirit::x3;
        using x3::int_;
        x3::rule<class number, ast::number> const number = "number";
        auto const number_def = int_;
        BOOST_SPIRIT_DEFINE(number)
    }
  }

  int main()
  {
    using boost::spirit::x3::ascii::space;
    using client::parser::number;
    std::istringstream iss("1 02 030 00400 0005");
    std::vector<client::ast::number> nums;
    boost::spirit::istream_iterator iter(iss >> std::noskipws), eof;
    bool ok = phrase_parse(iter, eof, *number, space, nums);
    if (ok)
    {
        std::cout << "parsed: " << std::endl;
        for (size_t i = 0; i < nums.size(); ++i)
        {
            std::cout << nums[i].number << "\n";
        }
    }
  }

该程序的结果是:

  parsed:
  1
  2
  30
  400
  5

我需要

  parsed:
  1
  02
  030
  00400
  00005

编辑

我在这方面取得了一些进展:

http://coliru.stacked-crooked.com/a/9f06f02613956230

#include <boost/spirit/home/x3.hpp>
#include <boost/fusion/adapted/struct.hpp>

namespace x3 = boost::spirit::x3;
namespace ast {
    struct fullnumber
    {
        std::string leadingZeros = "";
        int number = -1;
    };
}

BOOST_FUSION_ADAPT_STRUCT(ast::fullnumber, leadingZeros, number)
x3::rule<class fullnumber, ast::fullnumber> const fullnumber = "fullnumber";
auto const fullnumber_def = x3::lexeme[-(+x3::char_("0") >> &x3::int_) >> +x3::int_];
BOOST_SPIRIT_DEFINE(fullnumber);

int main() {
    std::vector<ast::fullnumber> fullnumbers;
    std::string parse_numbers_input("0 1 00 01 20 003000 00004 500000");
    auto begin = parse_numbers_input.begin();
    auto end = parse_numbers_input.end();
    bool ok = phrase_parse(begin, end, *fullnumber, x3::space, fullnumbers);
    if (ok) {
        std::cout << "parsed: " << std::endl;
        for (auto n : fullnumbers)
            std::cout << "leading: '" << n.leadingZeros << "', num: " << n.number << "\n";
    }
}
parsed: 
leading: '0', num: 0
leading: '', num: 1
leading: '00', num: 0
leading: '0', num: 1
leading: '', num: 20
leading: '00', num: 3000
leading: '0000', num: 4
leading: '', num: 500000

您可以看到我已经接近我想要的了。诀窍是要了解x3 :: lexeme是必需的,因为如果不使用该解析器,则解析器将始终在每个元素之间使用分隔符。所以       x3 :: lexeme [-(+ x3 :: char _(“ 0”)>>&x3 :: int_)>> + x3 :: int_]; 说:[可选]所有零,后跟一个整数(非消耗性),然后是一个整数。

我还有一个关于解析器正在做什么的问题:

|----|----------|----------|-----------|----------|
| id | input    | leading  | number    | expected |
|----|----------|----------|-----------|----------|
| 1  |   0      |     0    |    0      |    no    |
|----|----------|----------|-----------|----------|
| 2  |   1      |          |    1      |    yes   |
|----|----------|----------|-----------|----------|
| 3  |   00     |     00   |    0      |    no    |
|----|----------|----------|-----------|----------|
| 4  |   01     |     0    |    1      |    yes   |
|----|----------|----------|-----------|----------|
| 5  |   20     |          |    20     |    yes   |
|----|----------|----------|-----------|----------|
| 6  |   003000 |     00   |    3000   |    yes   |
|----|----------|----------|-----------|----------|
| 7  |   00004  |     0000 |    4      |    yes   |
|----|----------|----------|-----------|----------|
| 8  |   500000 |          |    500000 |    yes   |
|----|----------|----------|-----------|----------|
  • 对于1,我期望前导=“”,num =“ 0”
  • 对于3,我期望前导=“ 0”,num =“ 0”

在这种情况下为什么两次发现0?

1 个答案:

答案 0 :(得分:1)

就像其他评论者所说的那样,只是解析为字符串。

如果您仍然希望Spirit的int_解析器方便地解析(带符号的)整数,请将其包装在raw[]中以传播到迭代器范围(与字符串兼容):

Live On Coliru

#include <boost/spirit/home/x3.hpp>
#include <boost/spirit/include/support_istream_iterator.hpp>
#include <iostream>
#include <iomanip>

namespace x3 = boost::spirit::x3;

int main() {
    std::istringstream iss("1 02 030 00400 0005");
    std::vector<std::string> nums;
    boost::spirit::istream_iterator iter(iss >> std::noskipws), eof;

    bool ok = phrase_parse(iter, eof, *x3::raw[x3::int_], x3::space, nums);
    if (ok) {
        std::cout << "parsed: " << std::endl;
        for (auto num : nums)
            std::cout << std::quoted(num) << "\n";
    }
}

打印

parsed: 
"1"
"02"
"-030"
"00400"
"0005"