std :: bitset哈希函数算法

时间:2017-05-13 17:40:23

标签: c++ bitset

有人知道bitset的哈希函数使用了什么算法,

这是来自网站:http://en.cppreference.com/w/cpp/utility/bitset/hash

#include <iostream>
#include <bitset>
#include <functional>

int main()
{
    std::bitset<4> b1(1);
    std::bitset<4> b2(2);
    std::bitset<4> b3(b2);
    std::bitset<4> b4(8);
    std::cout<<b4<<'\n';
    std::hash<std::bitset<4>> hash_fn;

    size_t h1 = hash_fn(b1);
    size_t h2 = hash_fn(b2);
    size_t h3 = hash_fn(b4);

    std::cout << h1 << '\n';
    std::cout << h2 << '\n';
    std::cout << h3 << '\n';
}

,输出

1000
4334672815104069193
16667047557902998627
2258353126044249582

http://en.cppreference.com/w/cpp/utility/bitset/hash

为什么不将这些位转换为unsigend long并生成哈希值?

1 个答案:

答案 0 :(得分:5)

作为noted by Igor,C ++标准没有指定算法,它only requires哈希值仅取决于对象,并且在程序的持续时间内相同:{{3} }

  

20.5.3.4哈希要求[hash.requirements]   1如果出现以下情况,H类型H符合Hash要求:

     
      
  • (1.1)它是一个函数对象类型,
  •   
  • (1.2)它满足CopyConstructible和Destructible的要求,
  •   
  • (1.3)   表29中显示的表达式是有效的,并具有指示的语义。
  •   
     

2给定Key是H类型的函数对象的参数类型,在表29中,h是类型的值(可能是const)H,u是Key类型的左值,k是可转换为的类型的值(可能是const)Key。

     

表29 - 哈希要求

     
      
  • 表达式返回类型要求
  •   
  • h(k)size_t返回的值仅取决于程序持续时间的参数k。 [注:因此所有的评价   具有相同k值的表达式h(k)产生与a相同的结果   执行程序。 - 尾注] [注:两种不同   值t1和t2,h(t1)和h(t2)比较的概率相等   应该很小,接近1.0 /   numeric_limits ::最大()。 - 尾注]
  •   
  • h(u)size_t不得修改你。
  •   

Gcc的bitset的libstdc ++实现使用std :: hash:http://eel.is/c++draft/hash.requirements

#if __cplusplus >= 201103L
  // DR 1182.
  /// std::hash specialization for bitset.
  template<size_t _Nb>
    struct hash<__debug::bitset<_Nb>>
    : public __hash_base<size_t, __debug::bitset<_Nb>>
    {
      size_t
      operator()(const __debug::bitset<_Nb>& __b) const noexcept
      { return std::hash<_GLIBCXX_STD_C::bitset<_Nb>>()(__b._M_base()); }
    };
#endif

https://github.com/gcc-mirror/gcc/blob/master/libstdc%2B%2B-v3/include/debug/bitset

  // DR 1182.
  /// std::hash specialization for bitset.
  template<size_t _Nb>
    struct hash<_GLIBCXX_STD_C::bitset<_Nb>>
    : public __hash_base<size_t, _GLIBCXX_STD_C::bitset<_Nb>>
    {
      size_t
      operator()(const _GLIBCXX_STD_C::bitset<_Nb>& __b) const noexcept
      {
        const size_t __clength = (_Nb + __CHAR_BIT__ - 1) / __CHAR_BIT__;
        return std::_Hash_impl::hash(__b._M_getdata(), __clength);
      }
    };

LLVM的libcxx使用自己的bitset实现,xoring所有单词:https://github.com/gcc-mirror/gcc/blob/1cb6c2eb3b8361d850be8e8270c597270a1a7967/libstdc%2B%2B-v3/include/std/bitset#L1561

template <size_t _Size>
struct _LIBCPP_TEMPLATE_VIS hash<bitset<_Size> >
    : public unary_function<bitset<_Size>, size_t>
{
    _LIBCPP_INLINE_VISIBILITY
    size_t operator()(const bitset<_Size>& __bs) const _NOEXCEPT
        {return __bs.__hash_code();}
};

template <size_t _N_words, size_t _Size>
inline
size_t
__bitset<_N_words, _Size>::__hash_code() const _NOEXCEPT
{
    size_t __h = 0;
    for (size_type __i = 0; __i < _N_words; ++__i)
        __h ^= __first_[__i];
    return __h;
}

和1个字位集的简单变体:

inline
size_t
__bitset<1, _Size>::__hash_code() const _NOEXCEPT
{
    return __first_;
}