array,std :: list,std :: vector插入时间

时间:2017-03-30 22:32:22

标签: c++ c++11 data-structures

我正在制作一个测试程序来测量每个容器的存储时间。以下是我的测试代码。

#include <list>
#include <vector>
#include <iostream>
#include <iomanip>
#include <string>
#include <ctime>
#include <cstdlib>
using namespace std;

void insert(list<short>& l, const short& value);
void insert(vector<short>& v, const short& value);
void insert(short arr[], int& logicalSize, const int& physicalSize, const short& value);

int main() {
    clock_t start, end;
    srand(time(nullptr));

    const int SIZE = 50000;
    const short RANGE = 10000;
    list<short> l;
    vector<short> v;
    short* arr = new short[SIZE];
    int logicalSize = 0;

    // array
    start = clock();
    cout << "Array storage time test...";
    for (int i = 0; i < SIZE; i++) {
        try {
            insert(arr, logicalSize, SIZE, (short)(rand() % (2 * RANGE + 1) - RANGE));
        } catch (string s) {
            cout << s << endl;
            system("pause");
            exit(-1);
        }
    }
    end = clock();
    cout << "Time: " << difftime(end, start) << endl << endl;

    // list
    cout << "List storage time test...";
    start = clock();
    for (int i = 0; i < SIZE; i++) {
        insert(l, (short)(rand() % (2 * RANGE + 1) - RANGE));
    }
    end = clock();
    cout << "Time: " << difftime(end, start) << endl << endl;

    // vector
    cout << "Vector storage time test...";
    start = clock();
    for (int i = 0; i < SIZE; i++) {
        insert(v, (short)(rand() % (2 * RANGE + 1) - RANGE));
    }
    end = clock();
    cout << "Time: " << difftime(end, start) << endl << endl;



    delete[] arr;
    system("pause");
    return 0;
}

void insert(list<short>& l, const short& value) {
    for (auto it = l.begin(); it != l.end(); it++) {
        if (value < *it) {
            l.insert(it, value);
            return;
        }
    }
    l.push_back(value);
}

void insert(vector<short>& v, const short& value) {
    for (auto it = v.begin(); it != v.end(); it++) {
        if (value < *it) {
            v.insert(it, value);
            return;
        }
    }
    v.push_back(value);
}

void insert(short arr[], int& logicalSize, const int& physicalSize, const short& value) {
    if (logicalSize == physicalSize) throw string("No spaces in array.");
    for (int i = 0; i < logicalSize; i++) {
        if (value < arr[i]) {
            for (int j = logicalSize - 1; j >= i; j--) {
                arr[j + 1] = arr[j];
            }
            arr[i] = value;
            logicalSize++;
            return;
        }
    }
    arr[logicalSize] = value;
    logicalSize++;
}

但是,当我执行代码时,结果似乎与理论略有不同。列表应该是最快的,但结果表明列表中的插入速度最慢。你能告诉我为什么吗?

2 个答案:

答案 0 :(得分:2)

插入矢量或数组需要移动后面的所有内容;因此,如果在随机点,每个元素平均需要1.5次访问。 0.5找到斑点,然后用0.5 * 2(读写)来插入。

插入列表需要每个元素0.5次访问(以找到该点)。

这意味着向量只是元素访问量的3倍。

列表节点比矢量“节点”(它们只是元素)大5到9倍。前向迭代需要读取3到5倍的内存(元素16位,指针32到64位)。

因此列表解决方案读取/写入更多内存!更糟糕的是,它更稀疏(使用后退指针),它可能不会以缓存友好的方式排列在内存中(向量是连续的;列表节点可能是线性空间中的混乱)因此搞乱与cpu内存缓存预测和负载等。

列表很少比矢量快;你必须多次插入/删除次数,而不是迭代列表。

最后,vector使用指数分配和保留的未使用空间。列表每次分配。调用// Array.sortIgnoreCase() polyfill if (!Array.prototype.sortIgnoreCase) { Array.prototype.sortIgnoreCase = function () { return this.sort(function (a, b) { return a.toLowerCase().localeCompare(b.toLowerCase()); }); }; } 的速度很慢,而且当你要求更大的块时,通常不会慢得多。每次将一个向量增加1000次导致大约15次分配(给予或接受);列表,1000个分配。

答案 1 :(得分:0)

list中插入速度非常快,但首先您必须找到要插入的内容。这是list失败的地方。

在某个时间停止阅读Why is it faster to process a sorted array than an unsorted array?可能会有所帮助,因为它涵盖了类似的材料,并且非常适合。

使用vector或数组,每个元素都会在下一个元素之后出现。预测很容易,因此CPU可以使用您在处理当前值的同时不需要的值加载缓存。

如果出现list可预测性,则必须先获取下一个节点,然后再加载节点,这几乎会使缓存无效。 Without the cache you can see an order of magnitude degradation in performance因为CPU等待从RAM中检索数据。

Bjarne Stroustrup has a number of longer pieces on this topic。主题视频绝对值得关注。

一个重要的考虑因素是使用Big-O表示法,因为它测量的是算法的效率,而不是算法利用硬件的程度。