为什么C ++中的缓冲很重要?

时间:2011-02-25 02:34:16

标签: c++ buffer

我试图打印Hello World 200,000次,这让我永远,所以我必须停下来。但是在我添加char数组作为缓冲区之后,它花了不到10秒。为什么呢?

在添加缓冲区之前:

#include <iostream> 
using namespace std;

int main() {
        int count = 0;
        std::ios_base::sync_with_stdio(false);
        for(int i = 1; i < 200000; i++)
        {       
                cout << "Hello world!\n";
                count++;
        }
                cout<<"Count:%d\n"<<count;
return 0;
}

这是在添加缓冲区之后:

#include <iostream> 
using namespace std;

int main() {
        int count = 0;
        std::ios_base::sync_with_stdio(false);
        char buffer[1024];
        cout.rdbuf()->pubsetbuf(buffer, 1024);
        for(int i = 1; i < 200000; i++)
        {       
                cout << "Hello world!\n";
                count++;
        }
                cout<<"Count:%d\n"<<count;
return 0;
}

这让我想到了Java。使用BufferReader读取文件有什么好处?

5 个答案:

答案 0 :(得分:24)

对于文件操作,写入内存(RAM)总是比直接写入磁盘上的文件更快。

为了说明,我们来定义:

  • 对磁盘上的文件执行每次写入IO操作的成本为1 ms
  • 通过网络对磁盘上的文件进行每次写IO操作都需要5毫秒
  • 每次写入IO操作到内存的成本为0.5毫秒

假设我们必须将一些数据写入文件100次。

案例1:直接写入磁盘上的文件

100 times x 1 ms = 100 ms

案例2:直接写入网络上的文件

100 times x 5 ms = 500 ms

案例3:在写入磁盘上的文件之前在内存中缓冲

(100 times x 0.5 ms) + 1 ms = 51 ms

案例4:在通过网络写入文件之前缓冲内存

(100 times x 0.5 ms) + 5 ms = 55 ms

结论

内存缓冲总是比直接操作更快。但是,如果您的系统内存不足并且必须与页面文件交换,那么它将再次变慢。因此,您必须在内存和磁盘/网络之间平衡IO操作。

答案 1 :(得分:3)

写入磁盘的主要问题是写入时间不是数字字节的线性函数,而是具有巨大常数的仿射函数。

在计算方面,这意味着,对于IO,您具有良好的吞吐量(低于内存,但仍然相当不错),但是您的延迟很差(通常比网络好一点)。

如果您查看HDD或SSD的评估文章,您会发现读/写测试分为两类:

  • 随机读取的吞吐量
  • 连续读取的吞吐量

后者通常明显大于前者。

通常,操作系统和IO库应该为您抽象,但正如您所注意到的,如果您的例程是IO密集型的,您可能会通过增加缓冲区大小来获得。这是正常的,该库通常适合各种用途,因此为普通应用提供了良好的中间立场。如果您的应用程序不是“平均”,那么它的执行速度可能不会那么快。

答案 2 :(得分:2)

您使用的是什么编译器/平台?我认为这里没有显着差异(RedHat,gcc 4.1.2);两个程序都需要5-6秒才能完成(但“用户”时间约为150毫秒)。如果我将输出重定向到一个文件(通过shell),总时间大约为300毫秒(因此等待我的控制台赶上程序所花费的大部分时间都是6秒。)

换句话说,输出应该默认缓冲,所以我很好奇为什么你会看到如此巨大的加速。

3个与切线相关的注释:

  1. 您的程序有一个错误的错误,因为您只打印199999次而不是指定的200000次(以i = 0开头或以i <= 200000结尾)
  2. 在输出计数时,您将printf语法与cout语法混合......对此的修复非常明显。
  3. 在输出到控制台时,禁用sync_with_stdio会为我带来一个小的加速(约5%),但重定向到文件时影响可以忽略不计。这是一个微观优化,在大多数情况下你可能不需要(恕我直言)。

答案 3 :(得分:1)

如果你有一个缓冲区,你会得到更少的实际I / O调用,这是一个缓慢的部分。首先,缓冲区被填充,然后进行一次I / O调用以刷新缓冲区。在Java或任何其他I / O速度慢的系统中同样有用。

答案 4 :(得分:1)

cout函数包含许多隐藏和复杂的逻辑,一直到内核,所以你可以将文本写入屏幕,当你以这种方式使用缓冲区时,你基本上做一个批量请求而不是重复复杂的I / O调用。