我对C ++很新,我正在尝试编写代码来对大数据文件进行一些分析。我已经设法编写生成文本文件的代码,其中每行只显示一个单词/数字(有数百万行)。但是,第一个~3000左右的行包含我的分析不需要的无用的东西。
唯一的问题是,实际数据从不同的行号开始,具体取决于输入文件。
有没有办法编写一个快速代码来搜索文本文档并删除所有行,直到找到关键字"<event>"
为止?
更新: 我得到了它的工作!可能比建议的要复杂一些,但它仍然有效。
感谢您的帮助!
#include <iostream>
#include <fstream>
#include <cstdio>
#include <cstring>
using namespace std;
int main()
{
int counter = 0;
ifstream FileSearch("OutputVector.txt"); // search OutputVector input file.
while(!FileSearch.eof())
{
counter++;
string temp;
FileSearch >> temp;
if(temp == "<event>")
{
break; //While loop adding +1 to counter each time <event> is not found.
}
}
std::ofstream outFile("./final.txt"); //Create output file "final.txt."
std::string line;
std::ifstream inFile("OutputVector.txt"); //open input file OutputVector again.
int count = 0;
while(getline(inFile, line)){
if(count > counter-2){
outFile << line << std::endl;
}
count++; //while loop counts from counter-2 until the end and writes them to the new file.
}
outFile.close();
inFile.close(); //close the files.
remove("OutputVector.txt"); //Delete uneeded OutputVector File.
}
答案 0 :(得分:2)
基本骨架:
std::ifstream stream("file name goes here")
std::string line;
// optional: define line number here
while (std::getline (stream, line))
{
// optional: increment line number here
if (line.find("<event>") != line.npos)
{ // Deity of choice help you if <event> naturally occurs in junk lines.
// Extra smarts may be required here.
doStuffWithRestOfFile(stream);
break;
}
}
关于您希望如何修改源文件以回答该子问题的信息不足。一旦你让读者继续前进,如果你没有弄清楚,请问一个新问题。
编辑:短版
std::ifstream stream("file name goes here")
std::string line;
// optional: define line number here
while (std::getline (stream, line) && (line.find("<event>") == line.npos))
{
// optional: increment line number here
}
doStuffWithRestOfFile(stream);
答案 1 :(得分:0)
如果要使用新版本覆盖文件(没有开头),您可以将所有文件读取到内存并覆盖它,或者在读取第一个文件时写入第二个文件,然后在之后移动/重命名
读取所有行,直到找到<event>
:
std::ifstream input_file( filePath );
std::string line;
int current_line = 0;
do
{
std::getline( input_file, line );
++current_line;
}
while( line.find("<event>") == line.npos );
// use input_line to process the rest of the file
请注意,如果"<event>"
是第一行,那么在do while
之后,current_line
将包含1,而不是0