C ++删除.txt文件中的所有行,直到达到某个关键字

时间:2015-06-03 17:45:50

标签: c++ text

我对C ++很新,我正在尝试编写代码来对大数据文件进行一些分析。我已经设法编写生成文本文件的代码,其中每行只显示一个单词/数字(有数百万行)。但是,第一个~3000左右的行包含我的分析不需要的无用的东西。

唯一的问题是,实际数据从不同的行号开始,具体取决于输入文件。

有没有办法编写一个快速代码来搜索文本文档并删除所有行,直到找到关键字"<event>"为止?

更新: 我得到了它的工作!可能比建议的要复杂一些,但它仍然有效。

感谢您的帮助!

    #include <iostream>
    #include <fstream>
    #include <cstdio>
    #include <cstring>
    using namespace std;

    int main()
    {

        int counter = 0;

    ifstream FileSearch("OutputVector.txt"); // search OutputVector input file.

    while(!FileSearch.eof())
    {
        counter++;
        string temp;
        FileSearch >> temp;

        if(temp == "<event>")
        {
            break; //While loop adding +1 to counter each time <event> is not found.
        }
    }



    std::ofstream outFile("./final.txt"); //Create output file "final.txt."
    std::string line;

 std::ifstream inFile("OutputVector.txt"); //open input file OutputVector again.

 int count = 0;

 while(getline(inFile, line)){

     if(count > counter-2){
        outFile << line << std::endl;
     }
     count++; //while loop counts from counter-2 until the end and writes them to the new file.
 }
 outFile.close();
 inFile.close(); //close the files.
 remove("OutputVector.txt"); //Delete uneeded OutputVector File.
}

2 个答案:

答案 0 :(得分:2)

基本骨架:

std::ifstream stream("file name goes here")
std::string line;
// optional: define line number here
while (std::getline (stream, line))
{
    // optional: increment line number here
    if (line.find("<event>") != line.npos)
    {  // Deity of choice help you if <event> naturally occurs in junk lines. 
       // Extra smarts may be required here.
        doStuffWithRestOfFile(stream);
        break;
    } 
}

关于您希望如何修改源文件以回答该子问题的信息不足。一旦你让读者继续前进,如果你没有弄清楚,请问一个新问题。

编辑:短版

std::ifstream stream("file name goes here")
std::string line;
// optional: define line number here
while (std::getline (stream, line) && (line.find("<event>") == line.npos))
{
    // optional: increment line number here
}
doStuffWithRestOfFile(stream);

答案 1 :(得分:0)

如果要使用新版本覆盖文件(没有开头),您可以将所有文件读取到内存并覆盖它,或者在读取第一个文件时写入第二个文件,然后在之后移动/重命名

读取所有行,直到找到<event>

std::ifstream input_file( filePath );
std::string line;
int current_line = 0;

do
{
   std::getline( input_file, line );
   ++current_line;
}
while( line.find("<event>") == line.npos );
// use input_line to process the rest of the file

请注意,如果"<event>"是第一行,那么在do while之后,current_line将包含1,而不是0