Question

我正在实现tbb的并发哈希映射，以将其性能与一组其他并发哈希表进行比较。

然而，我从中获得的性能是可怕的，我无法相信它与其他并发哈希表相比那么慢

以下是我的实现：

class TBB: public TestDs{
    typedef tbb::concurrent_hash_map<int,int, HashCompare<int> > hash_t;
private:
        hash_t _ds;
public:
        TBB(const Configuration& config) : _ds(config.initial_count) {
        }

    bool containsKey(int key) {
        hash_t::accessor a;

        if(_ds.find(a,key)){
            return true;
        }
        else 
            return false;
    }

    int get(int key) {
        hash_t::accessor a;

        if(_ds.find(a,key)){
             return (int)(a->second);
        }
        else 
            return 0;
    }

    int put(int key, int value) {
        return _ds.insert( std::make_pair(key, value) );
    }

    int remove(int key) {
        return _ds.erase(key);
    }

    int size() {
        return _ds.size();
    }
    const char* name() {
        return "TBB";
    }
    void print() {}
    void shutdown() {}

};

有没有人看到我的实施有任何问题，或者知道为什么它可能执行缓慢的任何原因？它需要超过30分钟才能在单个线程环境中插入200,000个元素。为了正确看待这一点，几乎所有其他表都在不到5分钟的时间内完成了这项测试。

这是我的构建代码：

-w  -DNDEBUG -g -msse2 -m32  -DINTEL -D_REENTRANT -lrt -pthread -fno-strict-aliasing -l cds -l tbb -lllalloc

更新：我已经调整了我的测试代码，将哈希表预填充到1000而不是100,000。再次运行时，tbb执行92 op / sec，而另一个实现执行89431 op / sec。（64线程环境）......只是说某些东西似乎不对......

其他信息：计算机是HP Z600工作站，具有6GB的RAM和6个核心。

注意交叉定位：http://software.intel.com/en-us/forums/showthread.php?t=86119

Answer 1

你HashCompare::hash()返回sizeof(int)，我猜，这意味着每个条目都会映射到同一个存储桶中。看起来你并没有将它用作哈希表，而是更多的链表。

您可以尝试使用Boost的哈希：

#include <boost/functional/hash.hpp>

template<typename K> 
struct HashCompare { 
    static size_t hash( const K& key )                  { return boost::hash_value(key); } 
    static bool   equal( const K& key1, const K& key2 ) { return ( key1 == key2 ); } 
};

TBB Concurrent Hash地图

1 个答案: