STL中关联数组(map)的速度

时间:2015-02-16 18:22:32

标签: c++ stl

写了一个简单的程序来测量STL的速度。以下代码显示我的Corei7-2670QM PC(2.2GHz和turbo 3.1GHz)耗时1.49秒。如果我删除循环中的Employees[buf] = i%1000;部分,则只需要0.0132秒。因此散列部分耗时1.48秒。为什么这么慢?

#include <string.h>
#include <iostream>
#include <map>
#include <utility>
#include <stdio.h>
#include <sys/time.h>
using namespace std;

extern "C" {
int get(map<string, int> e, char* s){
    return e[s];
}
int set(map<string, int> e, char* s, int value) {
    e[s] = value;
}
}

double getTS() {
    struct timeval tv;
    gettimeofday(&tv, NULL);
    return tv.tv_sec + tv.tv_usec/1000000.0;
}

int main()
{
    map<string, int> Employees;
    char buf[10];
    int i;
    double ts = getTS();
    for (i=0; i<1000000; i++) {
        sprintf(buf, "%08d", i);
        Employees[buf] = i%1000;
    }
    printf("took %f sec\n", getTS() - ts);
    cout << Employees["00001234"] << endl;
    return 0;
}

2 个答案:

答案 0 :(得分:1)

这是您的代码的C ++版本。请注意,在<{1}} / get中传递地图时,您应该 显然 通过引用获取地图。

更新更进一步,并针对给定的测试用例进行认真优化:

<强> Live On Coliru

set

打印

#include <iostream>
#include <boost/container/flat_map.hpp>
#include <chrono>
using namespace std;

using Map = boost::container::flat_map<string, int>;

int get(Map &e, char *s) { return e[s]; }
int set(Map &e, char *s, int value) { return e[s] = value; }

using Clock = std::chrono::high_resolution_clock;

template <typename F, typename Reso = std::chrono::microseconds, typename... Args> 
Reso measure(F&& f, Args&&... args) {
    auto since = Clock::now();
    std::forward<F>(f)(std::forward<Args>(args)...);
    return chrono::duration_cast<Reso>(Clock::now() - since);
}

#include <boost/iterator/iterator_facade.hpp>

using Pair = std::pair<std::string, int>;

struct Gen : boost::iterators::iterator_facade<Gen, Pair, boost::iterators::single_pass_traversal_tag, Pair>
{
    int i;
    Gen(int i = 0) : i(i) {}

    value_type dereference() const { 
        char buf[10];
        std::sprintf(buf, "%08d", i);
        return { buf, i%1000 }; 
    }
    bool equal(Gen const& o) const { return i==o.i; }
    void increment() { ++i; }
};

int main() {
    Map Employees;
    const auto n = 1000000;

    auto elapsed = measure([&] {
            Employees.reserve(n);
            Employees.insert<Gen>(boost::container::ordered_unique_range, {0}, {n});
        });

    std::cout << "took " << elapsed.count() / 1000000.0 << " sec\n";

    cout << Employees["00001234"] << endl;
}

旧答案

这恰好使用了C ++

<强> Live On Coliru

took 0.146575 sec
234

打印:

#include <iostream>
#include <map>
#include <chrono>
#include <cstdio>
using namespace std;

int get(map<string, int>& e, char* s){
    return e[s];
}
int set(map<string, int>& e, char* s, int value) {
    return e[s] = value;
}

using Clock = std::chrono::high_resolution_clock;

template <typename Reso = std::chrono::microseconds>
Reso getElapsed(Clock::time_point const& since) {
    return chrono::duration_cast<Reso>(Clock::now() - since);
}

int main()
{
    map<string, int> Employees;
    std::string buf(10, '\0');

    auto ts = Clock::now();
    for (int i=0; i<1000000; i++) {
        buf.resize(std::sprintf(&buf[0], "%08d", i));
        Employees[buf] = i%1000;
    }
    std::cout << "took " << getElapsed(ts).count()/1000000.0 << " sec\n";
    cout << Employees["00001234"] << endl;
}

答案 1 :(得分:0)

“慢”的概念当然取决于什么。

我在MSVC2013上运行了您的基准测试(使用标准chrono::high_resolution_clock而不是gettimeofday()),在Corei7-920上以2.67 GHz的速度发布配置并找到非常相似的结果(1.452 s)。

在你的代码中,你基本上做了一百万:

  • 在地图中插入:Employees\[buf\]
  • 在地图中更新(将新元素复制到exisitng元素):= i%1000

所以我试着更好地了解花费的时间:

  • 首先,map需要存储有序密钥,通常使用二叉树实现。所以我尝试使用unordered_map,它使用更平坦的哈希表,并给它一个非常大的桶大小,以避免切换和重新散列。结果是1.198秒 所以大约 20%的时间(这里)需要对地图数据进行排序访问(即你可以使用键的顺序遍历地图:你需要这个吗?)

  • 接下来,玩插入顺序可以真正影响时间。正如 Thomas Matthews在评论中指出:出于基准测试目的,您应该使用随机顺序。

  • 然后,仅使用emplace_hint()进行数据的优化插入(无搜索无更新),我们的时间为1.100秒。
    因此需要75%的时间来分配和插入数据

  • 最后,详细说明了之前的测试,如果您在emplace_hint()之后添加额外的搜索和更新,则时间会略高于原始时间(1.468秒)。这确认了对映射的访问只是时间的一小部分,并且插入需要大部分执行时间。

这里是上述要点的测试:

chrono::high_resolution_clock::time_point ts = chrono::high_resolution_clock::now();
for (i = 0; i<1000000; i++) {
    sprintf(buf, "%08d", i);
    Employees.emplace_hint(Employees.end(), buf, 0);
    Employees[buf] = i % 1000;  // matters for 300 
}
chrono::high_resolution_clock::time_point te = chrono::high_resolution_clock::now();
cout << "took " << chrono::duration_cast<chrono::milliseconds>(te - ts).count() << " millisecs\n";

现在,您的基准测试不仅取决于地图的性能:您还需要100万sprintf()来设置缓冲区,以及100万转换为字符串。如果你改用地图,你会注意到整个测试只需要0.950s而不是1.450s:

  • 30%的基准时间不是由地图引起的,而是由您处理的许多字符串引起的!

当然,所有这一切都比矢量慢得多。但是矢量不对其元素进行排序,也不能提供关联存储。