我需要按顺序读取一个大文件(大约10GB)的所有块,该文件包含许多带有几个字符串的浮点数,如下所示(每个项目由'\ n'分割):
6.292611
-1.078219E-266
-2.305673E+065
sod;eiwo
4.899747e-237
1.673940e+089
-4.515213
我每次都阅读MAX_NUM_PER_FILE
项并处理它们并写入另一个文件,但我不知道ifstream
何时结束。
这是我的代码:
ifstream file_input(path_input); //my file is a text file, but i tried both text and binary mode, both failed.
if(file_input)
{
file_input.seekg(0,file_input.end);
unsigned long long length = file_input.tellg(); //get file size
file_input.seekg(0,file_input.beg);
char * buffer = new char [MAX_NUM_PER_FILE+MAX_NUM_PER_LINE];
int i=1,j;
char c,tmp[3];
while(file_input.tellg()<length)
{
file_input.read(buffer,MAX_NUM_PER_FILE);
j=MAX_NUM_PER_FILE;
while(file_input.get(c)&&c!='\n')
buffer[j++]=c; //get a complete item
//process with buffer...
itoa(i++,tmp,10); //int2char
string out_name="out"+string(tmp)+".txt";
ofstream file_output(out_name);
file_output.write(buffer,j);
file_output.close();
}
file_input.close();
delete[] buffer;
}
我的代码出错,length
大于实际文件大小。我尝试了file_input.good()
或!file_input.eof()
,但它们不起作用,getline(file_input,s)
很好,但它比read
慢得多,我想要read
,但是我不知道如何检查ifstream
是否为文件结尾。
我使用VS2010在WINDOWS 7中完成我的工作。
我已搜索过,但没有任何答案,How to open a file using ifstream and keep reading it until the end此链接无法回答我的问题。
更新,问题已解决
大家好,我已经弄清楚这是我的错。 while(file_input.tellg()<length)
和while(file_input.peek()!=EOF)
都可以正常使用!建议while(file_input.peek()!=EOF)
。
在文件结尾之后写的额外项目是上次写入的buffer
中的左侧项目。
这是正确的代码:
ifstream file_input(path_input);
if(file_input)
{
//file_input.seekg(0,file_input.end);
//unsigned long long length = file_input.tellg(); //get file size
//file_input.seekg(0,file_input.beg);
char * buffer = new char [MAX_NUM_PER_FILE+MAX_NUM_PER_LINE];
int i=1,j;
char c,tmp[3];
while(file_input.peek()!=EOF)
{
memset(buffer,0,sizeof(char)*(MAX_NUM_PER_FILE+MAX_NUM_PER_LINE)); //clear first!
file_input.read(buffer,MAX_NUM_PER_FILE);
j=MAX_NUM_PER_FILE;
while(file_input.get(c)&&c!='\n')
buffer[j++]=c;
itoa(i++,tmp,10);//int2char
string out_name="out"+string(tmp)+".txt";
ofstream file_output(out_name);
file_output.write(buffer,strlen(buffer)); //use the correct buffer size instead of j
file_output.close();
}
file_input.close();
delete[] buffer;
}
答案 0 :(得分:7)
while( file_input.peek() != EOF )
{
// code
}
基本上peek()
会读取下一个char
而不提取它。
因此,您只需将其与EOF
进行比较。