如何用C ++解析数字表

时间:2015-06-20 15:00:09

标签: c++ parsing numbers text-files tabular

我需要解析一个格式为ascii文本的数字表。每行文本有36个空格分隔的有符号整数,文件中有大约3000行。输入文件由我在Matlab中生成,因此我可以修改格式。另一方面,我也希望能够在VHDL中解析相同的文件,因此ascii文本是唯一可能的格式。

到目前为止,我有一个像这样的小程序可以遍历输入文件的所有行。我还没有找到一种方法来获取个别数字。我不是C ++最纯粹的。我会考虑fscanf(),但36个数字有点多。请建议从文本文件中获取数字的实用方法。

int main()
{
    string line;
    ifstream myfile("CorrOut.dat");
    if (!myfile.is_open())
        cout << "Unable to open file";
    else{
        while (getline(myfile, line))
        {
            cout << line << '\n';
        }
        myfile.close();
    }
    return 0;
}

2 个答案:

答案 0 :(得分:2)

使用std::istringstream。这是一个例子:

#include <sstream>
#include <string>
#include <fstream>
#include <iostream>

using namespace std;

int main()
{
    string line;
    istringstream strm;
    int num;
    ifstream ifs("YourData");
    while (getline(ifs, line))
    {
        istringstream strm(line);
        while ( strm >> num )
           cout << num << " ";
        cout << "\n";
    }
}

Live Example

如果要创建表格,请使用std::vector或其他合适的容器:

#include <sstream>
#include <string>
#include <fstream>
#include <iostream>
#include <vector>

using namespace std;

int main()
{
    string line;

    // our 2 dimensional table
    vector<vector<int>> table;

    istringstream strm;
    int num;
    ifstream ifs("YourData");
    while (getline(ifs, line))
    {
        vector<int> vInt;
        istringstream strm(line);
        while ( strm >> num )
           vInt.push_back(num);
        table.push_back(vInt);
    }
}

table向量逐行填充。注意我们创建了一个中间向量来存储每一行​​,然后将该行添加到表中。

Live Example

答案 1 :(得分:2)

您可以使用一些不同的方法,上面提供的方法可能是最快的方法,但是如果您有不同的分隔字符,您可以考虑以下解决方案之一:

第一种解决方案,逐行读取字符串。之后,它使用find函数来查找特定分隔符的第一个位置。然后删除读取的数字并继续,直到找不到分隔符。 您可以通过修改分隔符变量值来自定义分隔符。

#include <iostream>
#include <string>
#include <fstream>

using namespace std;

int main()
{
    string line;
    ifstream myfile("CorrOut.dat");
    string delimiter = " ";
    size_t pos = 0;
    string token;

    vector<vector<int>> data;

    if (!myfile.is_open())
        cout << "Unable to open file";
    else {
        while (getline(myfile, line))
        {
            vector<int> temp;
            pos = 0;
            while ((pos = line.find(delimiter)) != std::string::npos) {
                token = line.substr(0, pos);
                std::cout << token << std::endl;
                line.erase(0, pos + delimiter.length());
                temp.push_back(atoi(token.c_str()));
            }
            data.push_back(temp);
        }
        myfile.close();
    }
    return 0;
}

第二个解决方案使用正则表达式并且它不关心分隔符的使用,它将搜索并匹配字符串中找到的任何整数。

#include <iostream>
#include <string>
#include <regex> // The new library introduced in C++ 11
#include <fstream>

using namespace std;

int main()
{
    string line;
    ifstream myfile("CorrOut.dat");
    std::smatch m;
    std::regex e("[-+]?\\d+");

    vector<vector<int>> data;

    if (!myfile.is_open())
        cout << "Unable to open file";
    else {
        while (getline(myfile, line))
        {
            vector<int> temp;
            while (regex_search(line, m, e)) {
                for (auto x : m) {
                    std::cout << x.str() << " ";
                    temp.push_back(atoi(x.str().c_str()));
                }
                std::cout << std::endl;

                line = m.suffix().str();
            }

            data.push_back(temp);
        }
        myfile.close();
    }
    return 0;
}