解析csv文件c ++

时间:2016-01-20 15:16:33

标签: c++ excel parsing csv stl

我必须解析几个具有相同基本结构的csv文件,我必须将值保存在不同的矩阵中。 我想将每个表保存在一个矩阵中,但问题是我对endline字符有一些问题。 我尝试使用getline函数,但是在解析表时我无法终止while循环。

我使用此代码:

// MMDS.cpp : definisce il punto di ingresso dell'applicazione console.
//

#include "stdafx.h"
#include <iostream>
#include <fstream>
#include <string>
#include <vector>
#include <map>

using namespace std;

int i = 0, j = 0 , z=0;

int main()
{
    ifstream file("I_30_2_02_02_1.csv"); // declare file stream
    string value;
    string intvalue;
    string check;
    int jobs;
    int machines;
    int resources;
    vector<string> JobTime;
    vector<string> MachineId;
    vector<string> ProcTime; //archiviato come JobId MachineId ProcTime

    //prime tre righe
    getline(file, value, ';'); // #jobs
    getline(file, intvalue, '\n');
    jobs = stoi(intvalue);
    cout << "Jobs: " <<jobs << "\n";

    getline(file, value, ';'); //#machines
    getline(file, intvalue, '\n');
    machines = stoi(intvalue);
    cout << "Machines: " << machines << "\n";

    getline(file, value, ';'); //#resources
    getline(file, intvalue, '\n');
    resources = stoi(intvalue);
    cout << "Resources: " << resources << "\n";

    //scritte inutili
    getline(file, value, ';');
    cout << value << " ";
    getline(file, value, ';');
    cout << value << " ";
    getline(file, value, '\n');
    cout << value << "\n";

    //primo ciclo
    while (getline(file, intvalue)) {

        getline(file, intvalue, ';');
        JobTime.push_back(intvalue);
        getline(file, intvalue, ';');
        MachineId.push_back(intvalue);
        getline(file, intvalue, '\n');
        ProcTime.push_back(intvalue);
        //getline(file, intvalue, '\n');
    }

    for (i = 0; i <= ProcTime.size(); i++)
        cout << JobTime[i] << " " << MachineId[i] << " " << ProcTime[i] <<endl;

    cin >> intvalue;

    return 0;
}

csv文件是:

#Jobs;30
#Machines;2
#Resources;4

JobId;MachineId;PrTime
1;1;12
2;0;97
3;1;54
4;1;83
5;1;56
6;0;5
7;0;18
8;1;17
9;0;15
10;0;83

JobId;DueDate;RelDate;TardPenalty
1;575;4;1
2;563;70;2
3;483;1;8
4;519;68;1
5;540;64;10
6;546;126;8
7;550;2;6

每个表由其他表分隔一个空行。 有人可以帮我看每张桌子吗? 非常感谢

2 个答案:

答案 0 :(得分:2)

您可以使用peek()函数 检查file.peek()!=&#39; \ n&#39;
以下代码应该适合您。

#include <iostream>
#include <fstream>
#include <string>
#include <vector>
#include <map>

using namespace std;

int i = 0, j = 0 , z=0;

int main()
{
    ifstream file("I_30_2_02_02_1.csv"); // declare file stream
    if(!file)
        return 0;
    string value;
    string intvalue;
    string check;
    int jobs;
    int machines;
    int resources;
    vector<string> JobTime;
    vector<string> MachineId;
    vector<string> ProcTime; //archiviato come JobId MachineId ProcTime

    //prime tre righe

    getline(file, value, ';'); // #jobs
    getline(file, intvalue, '\n');  
    jobs = stoi(intvalue);
    cout << "Jobs: " <<jobs << "\n";    

    getline(file, value, ';'); //#machines
    getline(file, intvalue, '\n');
    machines = stoi(intvalue);
    cout << "Machines: " << machines << "\n";

    getline(file, value, ';'); //#resources
    getline(file, intvalue, '\n');
    resources = stoi(intvalue);
    cout << "Resources: " << resources << "\n";

    //scritte inutili
    getline(file, value, ';');
    cout << value << " ";
    getline(file, value, ';');
    cout << value << " ";
    getline(file, value, '\n');
    cout << value << "\n";
    //primo ciclo
    while (file.peek()!='\n') 
    {

        getline(file, intvalue, ';');
        JobTime.push_back(intvalue);
        getline(file, intvalue, ';');
        MachineId.push_back(intvalue);
        getline(file, intvalue, '\n');
        ProcTime.push_back(intvalue);
        //getline(file, intvalue, '\n');
    }

    for (i = 0; i < ProcTime.size(); i++)
        cout << JobTime[i] << " " << MachineId[i] << " " << ProcTime[i] <<endl;

    cin >> intvalue;

return 0;
}

答案 1 :(得分:1)

也许尝试if (entry.empty()),或某些条件。 另外,我认为getline()返回行的长度(0为空,因此空行将为&gt; 0)。所以它应该像找到空白行的大小一样简单。

while (getline(file, intvalue)) 
{
    if (intvalue > 0) 
    {
        getline(file, intvalue, ';');
        JobTime.push_back(intvalue);

        getline(file, intvalue, ';');
        MachineId.push_back(intvalue);

        getline(file, intvalue, '\n');
        ProcTime.push_back(intvalue);

    } else {
        break;
    }
}

或类似的东西。如果intvalue > 0不起作用,请找出空行的大小,并将其作为条件。

修改的: 作为替代方案,getline()也可以返回一个字符串。在我看来,这具有可搜索的好处。我在下面写了一个简短的例子。

size_t pos;
std::string str;
std::string token;
std::vector<std::string> line;

// get the entire line
while ( getline(file, str) )
{
    while ( (pos = str.find(';')) != std::string::npos)
    {
        // get content up to next semicolon     
        token = str.substr(0, pos);
        line.push_back(token);
        str.erase(0, pos + 1);
    }
    // get content to the end
    token = str.substr(0, pos);
    line.push_back(token);
}

第二个while循环查找每个分号,推送内容,然后删除它。在while循环之后,push_back()用于从最后一个分号到结尾的其余行。