我有一个大文件,我只需要从中获取最后一行(\n
只是行分隔符。)
我需要在iOS设备上完成此操作,因此它不会花费太多内存或CPU时间(比如读取整个文件)。
我怎么能在Objective-C,c ++或c ++ 11中做到这一点?
答案 0 :(得分:5)
从概念上讲,我认为你想要打开文件并寻找到最后的方式减去N个字节(可能是80或者其他)。然后读取并查找\ n。如果你没有找到它,那么先寻找N个字节并在那个N字节集上尝试,依此类推,直到你找到\ n。
对于特定的调用,这只是查找如何打开文件,寻找文件和读取数据的问题。应该非常简单。但我认为以上就是你想做的事情,并为N选择一个不太大的尺寸。
答案 1 :(得分:3)
我的生产代码中有这个功能。想法是尝试通过搜索和阅读来阅读最后一行。请看一下。
bool readLastLine(std::string const& filename, std::string& lastLine)
{
std::ifstream in(filename.c_str(),std::ifstream::binary);
if(!in) return false;
in.seekg(0, std::ifstream::end);
const std::streamoff len = in.tellg();
//empty file
if(len == 0)
{
lastLine = "";
return true;
}
int buf_size = 128;
std::vector<char> buf;
while(in)
{
if(buf_size > len)
{
buf_size = len;
}
buf.resize(buf_size);
in.seekg(0 - buf_size, std::ifstream::end);
in.read(&buf[0],buf_size);
//all content is in the buffer or we already have the complete last line
if(len == buf_size || std::count(buf.begin(), buf.end(), '\n') > 1)
{
break;
}
//try enlarge the buffer
buf_size *= 2;
}
//find the second line seperator from the end if any
auto i = std::find(++buf.rbegin(),buf.rend(), '\n');
lastLine.assign(i == buf.rend() ? buf.begin() : buf.begin() + std::distance(i, buf.rend()), buf.begin() + buf_size);
return true;
}
答案 2 :(得分:2)
@Nerdtron回答似乎对我来说最合适,如果你无法控制你的文件格式,但是......
如果您可以控制文件格式,则可以使用O(1)复杂度执行此操作。当您向其写入数据时,只需将最后一行开头的偏移量写入文件开头的(常量)偏移量。如果要读取它,请读取此偏移量,然后转到其中指定的偏移量。
答案 3 :(得分:0)
我想出了这个,试图改进布鲁斯,好处是缓冲区不需要调整大小,只是继续读取距离EOF更远的相同大小的字符:
std::string lastLine(std::ifstream &file)
{
if (!file.good()) throw exception("Bad stream on input");
const size_t bufSize = 80; // because why not? tweak if need to
char buf[bufSize];
string line;
int seek, nloff;
// iterate over multiples of bufSize while file ok
for (size_t n = 1; file; ++n)
{
// next seek position will be a multiple of bufSize
seek = -static_cast<int>(n * bufSize);
file.seekg(seek, file.end);
// read "bufSize" bytes into buffer
file.read(buf, bufSize);
// in case no newline found, seek past eof
nloff = -seek;
// find offset of last newline in buffer
for (size_t i = 0; i < bufSize; ++i)
{
if (buf[i] == '\n') nloff = i;
}
seek += nloff + 1; // new seek position is one character after found newline
if (seek >= 0) continue; // just kidding about the "past eof" part ;)
// seek to after found newline and get line
file.seekg(seek, file.end);
getline(file, line);
if (!line.empty()) break; // have result, break and return
}
if (file.good()) return line;
else return string();
}