C ++逐行读取文件,然后使用分隔符拆分每一行

时间:2010-10-11 22:14:01

标签: c++ readfile

我想逐行读取一个txt文件,在读完每一行之后,我想根据选项卡“\ t”拆分该行,并将每个部分添加到结构中的元素。

我的结构是1 * char和2 * int

struct myStruct
{
    char chr;
    int v1;
    int v2;
}

其中chr可以包含多个字符。

一行应该是这样的:

randomstring TAB number TAB number NL

4 个答案:

答案 0 :(得分:28)

尝试:
注意:如果chr可以包含多于1个字符,那么使用字符串来表示它。

std::ifstream file("plop");
std::string   line;

while(std::getline(file, line))
{
    std::stringstream   linestream(line);
    std::string         data;
    int                 val1;
    int                 val2;

    // If you have truly tab delimited data use getline() with third parameter.
    // If your data is just white space separated data
    // then the operator >> will do (it reads a space separated word into a string).
    std::getline(linestream, data, '\t');  // read up-to the first tab (discard tab).

    // Read the integers using the operator >>
    linestream >> val1 >> val2;
}

答案 1 :(得分:3)

除非您打算将此结构用于C,否则我会用std :: string替换目标char *。

接下来,由于我打算能够从流中读取它,我将编写以下函数:

std::istream & operator>>( std::istream & is, myStruct & my )
{
    if( std::getline(is, my.str, '\t') )
       return is >> my.v1 >> my.v2;
}

使用str作为std :: string成员。这将写入您的结构,使用tab作为第一个分隔符,然后任何空白分隔符将在下两个整数之前执行。 (你可以强制它使用标签)。

要逐行阅读,您可以继续阅读这些内容,或者首先将该行读入字符串,然后将字符串放入istringstream并调用上述内容。

您需要决定如何处理失败的读取。上述任何失败的读取都会使流处于失败状态。

答案 2 :(得分:2)

std::ifstream in("fname");
while(in){
    std::string line;
    std::getline(in,line);
    size_t lasttab=line.find_last_of('\t');
    size_t firsttab=line.find_last_of('\t',lasttab-1);
    mystruct data;
    data.chr=line.substr(0,firsttab).c_str();
    data.v1=atoi(line.substr(firsttab,lasttab).c_str());
    data.v2=atoi(line.substr(lasttab).c_str());
}

答案 3 :(得分:0)

在遵循这里的一些建议时,我遇到了一些困难,因此我发布了一个完整的示例,该示例在制表符分隔的文件上重载结构的输入和输出运算符。另外,它还可以从stdin或通过命令参数提供的文件中获取输入。

我相信这很简单,只要遵守运算符的语义即可。


pairwise.h

#ifndef PAIRWISE_VALUE
#define PAIRWISE_VALUE

#include <string>
#include <iostream>

struct PairwiseValue
{
    std::string labelA;
    std::string labelB;
    float value;
};

std::ostream& operator<<(std::ostream& os, const PairwiseValue& p);

std::istream& operator>>(std::istream& is, PairwiseValue& p);

#endif

pairwise.cc

#include "pairwise.h"

std::ostream& operator<<(std::ostream& os, const PairwiseValue& p)
{
    os << p.labelA << '\t' << p.labelB << '\t' << p.value << std::endl;
    return os;
}

std::istream& operator>>(std::istream& is, PairwiseValue& p)
{
    PairwiseValue pv;

    if ((is >> pv.labelA >> pv.labelB >> pv.value))
    {
        p = pv;
    }

    return is;
}

test.cc

#include <fstream>
#include "pairwise.h"

int main(const int argc, const char* argv[])
{
    std::ios_base::sync_with_stdio(false); // disable synch with stdio (enables input buffering)

    std::string ifilename;
    if (argc == 2)
    {
        ifilename = argv[1];
    }

    const bool use_stdin = ifilename.empty();
    std::ifstream ifs;
    if (!use_stdin)
    {
        ifs.open(ifilename);

        if (!ifs)
        {
            std::cerr << "Error opening input file: " << ifilename << std::endl;
            return 1;
        }
    }

    std::istream& is = ifs.is_open() ? static_cast<std::istream&>(ifs) : std::cin;

    PairwiseValue pv;

    while (is >> pv)
    {
        std::cout << pv;
    }

    return 0;
}

编译

g++ -c pairwise.cc test.cc
g++ -o test pairwise.o test.o

用法

./test myvector.tsv
cat myvector.tsv | ./test