了解c ++分配的内存量

时间:2017-08-21 13:54:08

标签: c++ memory memory-management valgrind

我正在尝试更好地理解在c ++中分配在堆上的内存量。我写了一个小测试程序,除了填充一些2D矢量之外什么都没做。我在linux 64bit VM上运行它并使用valgrind的massif工具来分析内存。

我正在运行此测试的环境:在Win10上的VirtualBox中运行的Linux VM。 VM配置:基本内存:5248MB,4CPU,上限为100%,磁盘类型VDI(动态分配存储)。

c ++内存分析测试程序:

/**
 * g++ -std=c++11 test.cpp -o test.o
 */

#include <string>
#include <vector>
#include <iostream>

using namespace std;

int main(int argc, char **arg) {
    int n = stoi(arg[1]);
    vector<vector<int> > matrix1(n);
    vector<vector<int> > matrix2(n);
    vector<vector<int> > matrix3(n);
    vector<vector<int> > matrix4(n);
    vector<vector<int> > matrix5(n);
    vector<vector<int> > matrix6(n);
    vector<vector<int> > matrix7(n);
    vector<vector<int> > matrix8(n);

    for (int i=0; i<n; ++i) {
        for (int j=0; j<n; ++j) {
            matrix1[i].push_back(j);
        }
    }

    for (int i=0; i<n; ++i) {
        for (int j=0; j<n; ++j) {
            matrix2[i].push_back(j);
        }
    }

    for (int i=0; i<n; ++i) {
        for (int j=0; j<n; ++j) {
            matrix3[i].push_back(j);
        }
    }

    for (int i=0; i<n; ++i) {
        for (int j=0; j<n; ++j) {
            matrix4[i].push_back(j);
        }
    }

    for (int i=0; i<n; ++i) {
        for (int j=0; j<n; ++j) {
            matrix5[i].push_back(j);
        }
    }

    for (int i=0; i<n; ++i) {
        for (int j=0; j<n; ++j) {
            matrix6[i].push_back(j);
        }
    }

    for (int i=0; i<n; ++i) {
        for (int j=0; j<n; ++j) {
            matrix7[i].push_back(j);
        }
    }

    for (int i=0; i<n; ++i) {
        for (int j=0; j<n; ++j) {
            matrix8[i].push_back(j);
        }
    }
}

我运行以下bash脚本以便以n的不同值提取内存配置文件(test.o是上面的程序,使用g ++ -std = c ++ 11编译,g ++是版本5.3.0 )

valgrind --tool=massif --massif-out-file=massif-n1000.txt ./test.o 250
valgrind --tool=massif --massif-out-file=massif-n1000.txt ./test.o 500
valgrind --tool=massif --massif-out-file=massif-n1000.txt ./test.o 1000
valgrind --tool=massif --massif-out-file=massif-n2000.txt ./test.o 2000
valgrind --tool=massif --massif-out-file=massif-n4000.txt ./test.o 4000
valgrind --tool=massif --massif-out-file=massif-n8000.txt ./test.o 8000
valgrind --tool=massif --massif-out-file=massif-n16000.txt ./test.o 16000
valgrind --tool=massif --massif-out-file=massif-n32000.txt ./test.o 32000

这给了我以下结果:

|--------------------------------|
| n     | peak heap memory usage |
|-------|------------------------|
| 250   | 2.1 MiB                |         
| 500   | 7.9 MiB                |
| 1000  | 31.2 MiB               |
| 2000  | 124.8 MiB              |
| 4000  | 496.5 MiB              |
| 8000  | 1.9  GiB               |
| 16000 | 6.2 GiB                |
| 32000 | 6.1 GiB                |
|--------------------------------|

每个矩阵的大小为n ^ 2,我总共有8个矩阵,因此我预计内存使用量大约为f(n) = 8 * n^2

问题1 从n = 250到n = 8000,为什么在n * = 2时内存使用量或多或少乘以4?

从n = 16000到n = 32000,发生了一些非常奇怪的事情,因为valgrind确实报告了内存减少。

问题2 在n = 16000和n = 32000之间发生了什么,堆内存怎么可能更少,而理论上应该分配更多数据?

见下面的massif-visualizer输出,n = 16000,n = 32000。

n=16000 n=32000

1 个答案:

答案 0 :(得分:30)

1)因为矩阵向量的大小(以及它们的内存占用量)增长为n 2 ,所以加倍n会导致内存使用量增加四倍。与完全关系的任何偏差(与渐近相反)都是由于不同的因素(例如malloc / std::allocator使用的元数据,{{1}使用的块大小倍增方法1}})

2)你开始耗尽内存,所以Linux开始 page 一些;如果要查看总计(活动+分页)内存使用情况,请使用vector。 (来源:http://valgrind.org/docs/manual/ms-manual.html