如何在一行中读取具有多个分隔符的文件

时间:2016-09-05 20:46:16

标签: c++ c++11

我正在尝试读取每行有多个分隔符的文件。 以下是数据

2,22:11
3,33:11
4,44:11
5,55:11
6,66:11
7,77:11
8,88:11
9,99:11
10,00:11
11,011:11
12,022:11
13,033:11
14,044:11
15,055:11
16,066:11
17,077:11
18,088:11
19,099:11

代码在

之下

在这里,我尝试先用逗号作为分隔符来读取行,然后获取行,然后是冒号。

#include <fstream>
#include <iostream>
#include <string>

int main() {
  std::string line;
  std::string token;
  std::ifstream infile;

  infile.open("./data.txt");
  while (std::getline(infile, line,',')) {
    std::cout << line << std::endl;
    while(getline(infile, token, ':'))
    {
      std::cout << " : " << token;
    }
  }
}

但代码存在问题,因为它正在跳过第一行。 此外,如果我评论第二个while循环,只有第一行被打印,下面是输出

Ian无法确定代码出错的地方

输出

2
 : 22 : 11
3,33 : 11
4,44 : 11
5,55 : 11
6,66 : 11
7,77 : 11
8,88 : 11
9,99 : 11
10,00 : 11
11,011 : 11
12,022 : 11
13,033 : 11
14,044 : 11
15,055 : 11
16,066 : 11
17,077 : 11
18,088 : 11
19,099 : 11

3 个答案:

答案 0 :(得分:2)

为什么有两个while

你的问题是你永远重复第二次。第一个while仅执行第一个2,第二个执行到文件末尾。

您可以使用一个while完成所有操作;

之类的东西
#include <fstream>
#include <iostream>

using namespace std;

int main() {
 std::string line;
 std::string token;
 std::string num;
 ifstream infile;
 infile.open("a.txt");
  while (   getline(infile, line,',')
         && getline(infile, token, ':')
         && getline(infile, num) ) 
    cout << line << ',' << token << ':' << num << endl;
}

答案 1 :(得分:2)

问题来自您使用std::getline两次的事实。

一开始你进入第一个循环。第一次调用std::getline会让您期望:第一行直到 ,分隔符。

然后在嵌套循环中输入第二个std::getline以获取该行的其余部分。但事实是,你永远不会离开第二个循环,直到文件结束。因此,您阅读所有文件:分隔符进行拆分。

当第二个std:getline结束文件末尾时,它将离开嵌套循环。

因为您已经阅读了所有文件,所以没有任何内容可供阅读,并且第一个循环直接退出。

这是一些帮助您理解上下文的调试:

#include <fstream>
#include <iostream>
#include <string>

int main() {
  std::string line;
  std::string token;
  std::ifstream infile;

  infile.open("./data.txt");
  while (std::getline(infile, line, ',')) {
    std::cout << "First loop : " << line << std::endl;
    while(getline(infile, token, ':'))
    {
      std::cout << "Inner loop : " << token << std::endl;
    }
  }
}

要打印的第一行是:

First loop : 2
Inner loop : 22
Inner loop : 11
3,33
Inner loop : 11
4,44

你可以清楚地看到它不会退出第二个循环直到结束。

我建议阅读整行,不用分隔符,然后使用量身定制的函数将字符串拆分为令牌。它会很容易也很干净。

解决方案:

#include <fstream>
#include <list>
#include <iostream>
#include <string>

struct line_content {
  std::string line_number;
  std::string token;
  std::string value;
};

struct line_content tokenize_line(const std::string& line)
{
  line_content l;

  auto comma_pos = line.find(',');
  l.line_number = line.substr(0, comma_pos);

  auto point_pos = line.find(':');
  l.token = line.substr(comma_pos + 1, point_pos - comma_pos);

  l.value = line.substr(point_pos + 1);

  return l;
}

void print_tokens(const std::list<line_content>& tokens)
{
  for (const auto& line: tokens) {
    std::cout << "Line number : " << line.line_number << std::endl;
    std::cout << "Token : " << line.token << std::endl;
    std::cout << "Value : " << line.value << std::endl;
  }
}

int main() {
  std::string line;
  std::ifstream infile;

  std::list<line_content> tokens;

  infile.open("./data.txt");
  while (std::getline(infile, line)) {
    tokens.push_back(tokenize_line(line));
  }

  print_tokens(tokens);

  return 0;
}

我认为你应该能够做你想做的事。

编译如下:g++ -Wall -Wextra --std=c++1y <your c++ file>

答案 2 :(得分:0)

如果要在多个分隔符上拆分字符串,而不必担心分隔符的顺序,可以使用std::string::find_first_of()

#include <fstream>
#include <iostream>
#include <streambuf>
#include <string>

int
main()
{
        std::ifstream f("./data.txt");
        std::string fstring = std::string(std::istreambuf_iterator<char>(f),
                                          std::istreambuf_iterator<char>());
        std::size_t next, pos = 0;
        while((next = fstring.find_first_of(",:\n", pos)) != std::string::npos)
        {
                std::cout.write(&fstring[pos], ++next - pos);
                pos = next;
        }

        std::cout << &fstring[pos] << '\n';

        return 0;
}