我正在实现tbb的并发哈希映射,以将其性能与一组其他并发哈希表进行比较。
然而,我从中获得的性能是可怕的,我无法相信它与其他并发哈希表相比那么慢
以下是我的实现:
class TBB: public TestDs{
typedef tbb::concurrent_hash_map<int,int, HashCompare<int> > hash_t;
private:
hash_t _ds;
public:
TBB(const Configuration& config) : _ds(config.initial_count) {
}
bool containsKey(int key) {
hash_t::accessor a;
if(_ds.find(a,key)){
return true;
}
else
return false;
}
int get(int key) {
hash_t::accessor a;
if(_ds.find(a,key)){
return (int)(a->second);
}
else
return 0;
}
int put(int key, int value) {
return _ds.insert( std::make_pair(key, value) );
}
int remove(int key) {
return _ds.erase(key);
}
int size() {
return _ds.size();
}
const char* name() {
return "TBB";
}
void print() {}
void shutdown() {}
};
有没有人看到我的实施有任何问题,或者知道为什么它可能执行缓慢的任何原因? 它需要超过30分钟才能在单个线程环境中插入200,000个元素。为了正确看待这一点,几乎所有其他表都在不到5分钟的时间内完成了这项测试。
这是我的构建代码:
-w -DNDEBUG -g -msse2 -m32 -DINTEL -D_REENTRANT -lrt -pthread -fno-strict-aliasing -l cds -l tbb -lllalloc
更新:我已经调整了我的测试代码,将哈希表预填充到1000而不是100,000。 再次运行时,tbb执行92 op / sec,而另一个实现执行89431 op / sec。 (64线程环境)......只是说某些东西似乎不对......
其他信息:计算机是HP Z600工作站,具有6GB的RAM和6个核心。
注意交叉定位:http://software.intel.com/en-us/forums/showthread.php?t=86119
答案 0 :(得分:11)
你HashCompare::hash()
返回sizeof(int)
,我猜,这意味着每个条目都会映射到同一个存储桶中。看起来你并没有将它用作哈希表,而是更多的链表。
您可以尝试使用Boost的哈希:
#include <boost/functional/hash.hpp>
template<typename K>
struct HashCompare {
static size_t hash( const K& key ) { return boost::hash_value(key); }
static bool equal( const K& key1, const K& key2 ) { return ( key1 == key2 ); }
};