我试图打印Hello World
200,000次,这让我永远,所以我必须停下来。但是在我添加char
数组作为缓冲区之后,它花了不到10秒。为什么呢?
在添加缓冲区之前:
#include <iostream>
using namespace std;
int main() {
int count = 0;
std::ios_base::sync_with_stdio(false);
for(int i = 1; i < 200000; i++)
{
cout << "Hello world!\n";
count++;
}
cout<<"Count:%d\n"<<count;
return 0;
}
这是在添加缓冲区之后:
#include <iostream>
using namespace std;
int main() {
int count = 0;
std::ios_base::sync_with_stdio(false);
char buffer[1024];
cout.rdbuf()->pubsetbuf(buffer, 1024);
for(int i = 1; i < 200000; i++)
{
cout << "Hello world!\n";
count++;
}
cout<<"Count:%d\n"<<count;
return 0;
}
这让我想到了Java。使用BufferReader读取文件有什么好处?
答案 0 :(得分:24)
对于文件操作,写入内存(RAM)总是比直接写入磁盘上的文件更快。
为了说明,我们来定义:
假设我们必须将一些数据写入文件100次。
100 times x 1 ms = 100 ms
100 times x 5 ms = 500 ms
(100 times x 0.5 ms) + 1 ms = 51 ms
(100 times x 0.5 ms) + 5 ms = 55 ms
内存缓冲总是比直接操作更快。但是,如果您的系统内存不足并且必须与页面文件交换,那么它将再次变慢。因此,您必须在内存和磁盘/网络之间平衡IO操作。
答案 1 :(得分:3)
写入磁盘的主要问题是写入时间不是数字字节的线性函数,而是具有巨大常数的仿射函数。
在计算方面,这意味着,对于IO,您具有良好的吞吐量(低于内存,但仍然相当不错),但是您的延迟很差(通常比网络好一点)。
如果您查看HDD或SSD的评估文章,您会发现读/写测试分为两类:
后者通常明显大于前者。
通常,操作系统和IO库应该为您抽象,但正如您所注意到的,如果您的例程是IO密集型的,您可能会通过增加缓冲区大小来获得。这是正常的,该库通常适合各种用途,因此为普通应用提供了良好的中间立场。如果您的应用程序不是“平均”,那么它的执行速度可能不会那么快。
答案 2 :(得分:2)
您使用的是什么编译器/平台?我认为这里没有显着差异(RedHat,gcc 4.1.2);两个程序都需要5-6秒才能完成(但“用户”时间约为150毫秒)。如果我将输出重定向到一个文件(通过shell),总时间大约为300毫秒(因此等待我的控制台赶上程序所花费的大部分时间都是6秒。)
换句话说,输出应该默认缓冲,所以我很好奇为什么你会看到如此巨大的加速。
3个与切线相关的注释:
i = 0
开头或以i <= 200000
结尾)printf
语法与cout
语法混合......对此的修复非常明显。sync_with_stdio
会为我带来一个小的加速(约5%),但重定向到文件时影响可以忽略不计。这是一个微观优化,在大多数情况下你可能不需要(恕我直言)。答案 3 :(得分:1)
如果你有一个缓冲区,你会得到更少的实际I / O调用,这是一个缓慢的部分。首先,缓冲区被填充,然后进行一次I / O调用以刷新缓冲区。在Java或任何其他I / O速度慢的系统中同样有用。
答案 4 :(得分:1)
cout函数包含许多隐藏和复杂的逻辑,一直到内核,所以你可以将文本写入屏幕,当你以这种方式使用缓冲区时,你基本上做一个批量请求而不是重复复杂的I / O调用。