在双精度数组上使用unordered_map

时间:2012-03-24 03:21:36

标签: c++ macos data-structures stl hash

我的主数据对象是一个长度为double的数组,它取决于我的类的特定实例。我想构造一个非常简单的哈希表来存储/检索这些对象,我们可以假设这些数字是以没有数字错误的方式生成的。

int main() {
  std::tr1::unordered_map<double*, double*> cache;

  double x1[] = { 1.0, 3.14 };
  double x2[] = { 1.0, 3.14 };

  cache[x1] = x1;

  std::cout << "x1: " << cache.count(x1) << std::endl;
  std::cout << "x2: " << cache.count(x2) << std::endl;

  return 0;
}

上面显然只比较了指针,给出了输出:

> ./tmp
x1: 1
x2: 0

当我真的想看时:

> ./tmp
x1: 1
x2: 1

当数组的大小在编译时固定时,如何创建自定义哈希和相等函数非常清楚,但我不知道如何创建依赖于特定实例的自定义函数。我在下面创建了一个类,但我不确定它是否有用,或者它是如何使用的。

class Hash_double_vec {

public:
  int dim;
  Hash_double_vec(int d) { dim = d; }

  size_t operator()(const double *x) const{
    std::tr1::hash<double> hash_fn;
    size_t r = hash_fn(x[0]);
    for(int i=1;i<dim;i++) r ^= hash_fn(x[i]);
    return r;
  }

  bool operator()(const double *x, const double *y) const{
    for(int i=1;i<dim;i++) if (fabs(x[i]-y[i]) > 1e-10) return false;
    return true;
  }
};

1 个答案:

答案 0 :(得分:3)

一种方法是创建struct来保存指向双精度序列的指针:

struct DoubleRegion
{
    double* p;
    size_t size;
};

bool operator==(DoubleRegion a, DoubleRegion b)
{
    return a.size == b.size && memcmp(a.p, b.p, a.size) == 0;
}

size_t hash(DoubleRegion dr) 
{
    size_t h = 0;
    for (double* p = dr.p; p != dr.p + dr.size; ++p)
        h ^= hash(*p);
    return h;
}

然后使用它:

unordered_map<DoubleRegion, DoubleRegion> cache;

当然,确保后备内存的生命周期是DoubleRegion生命周期的超集是你的问题。

旧答案

如果直到运行时才知道键和值有多大,请使用std :: vector:

unordered_map<vector<double>, vector<double>> cache;

如果你在编译时知道你可以使用std :: array多大:

unordered_map<array<double, N>, array<double, N>> cache;

在这两种情况下,默认的散列函数都可以根据需要按值运行,您无需定义自定义散列函数。