我有一个信息检索和存储课程项目,第一部分我必须找到从硬盘读取大文件的最佳缓冲区大小。我们的t.a说,随着缓冲区大小增加到某一点(通常是4个字节),读取速度会增加,但之后它会减少。但是使用下面的代码,无论缓冲区大小或文件大小(我已经在100 mb上测试过),它都会增加。据我所知,缓冲只在并行异步进程(如线程)中有意义,并且当文件进行碎片整理时,对缓冲区大小读取速度曲线的期望应该成立,以及查找文件目录和地址的成本(对于磁盘)是否足够重要,问题与我的代码或ifstream处理事物的方式有关,或者这些条件可能不适用于此处?
ifstream in("D:ISR\\Articles.dat", std::ifstream::binary);
if(in)
{
in.seekg(0, in.end);
int length = in.tellg();
length = 100 * 1024 * 1024;
int bufferSize = 2;
int blockSize = 1024;//1kB
int numberOfBlocks = length / blockSize;
if(length % blockSize > 0) numberOfBlocks++;
clock_t t;
double time;
for(int i = 0; i < 5; i++)
{
in.seekg(0, in.beg);
int position = 0;
int bufferPosition;
char* streamBuffer = new char[bufferSize];
in.rdbuf()->pubsetbuf(streamBuffer, bufferSize);
t = clock();
for(int i = 0; i < numberOfBlocks; i++)
{
char* buffer = new char[blockSize];
bufferPosition = 0;
while(bufferPosition < blockSize && position < length)
{
in.read(buffer + bufferPosition, bufferSize);
position += bufferSize;
bufferPosition += bufferSize;
}
delete[] buffer;
}
t = clock() - t;
time = double(t) / CLOCKS_PER_SEC;
cout << "Buffer size : " << bufferSize << " -> Total time in seconds : " << time << "\n";
bufferSize *= 2;
}
答案 0 :(得分:2)
我所知道的缓冲只在并行异步中才有意义 过程
没有!没有!在许多情况下缓冲是有意义的。常见的情况是I / O.如果增加读/写缓冲区的大小。操作系统可以更少地触摸I / O设备。
它可以在每个操作中读/写更大的块。然后,性能变得更好。
在2^n
中选择缓冲区大小:128,512,1024,...否则会降低性能。
答案 1 :(得分:0)
无论缓冲区大小或文件大小,它都会增加
以上陈述不成立。由于您重复测量程序,由于系统缓存的好处,后续结果将优于以前的结果。实际上,您从系统缓存而不是硬盘访问文件内容。但是,在缓冲区大小超过阈值后,读取性能将降低。感谢Richard Steven在APUE 2nd中的第3章,您可以找到详细而广泛的阅读和阅读实验。写缓冲区。