比std :: nth_element更快的东西

时间:2015-05-26 14:06:01

标签: c++ algorithm sorting c++11 kdtree

我正在开发kd-tree实现,而我目前正在使用 std :: nth_element 来按照中位数对元素向量进行分区。但是std :: nth_element占用树构造的90%的时间。任何人都可以提出更有效的替代方案吗?

提前致谢

2 个答案:

答案 0 :(得分:6)

你真的需要第n个元素,还是需要一个元素"在"附近?中间?

有更快的方法来获得元素"接近"中间。一个例子大致如下:

function rough_middle(container)
  divide container into subsequences of length 5
  find median of each subsequence of length 5 ~ O(k) * O(n/5)
  return rough_middle( { median of each subsequence} ) ~ O(rough_middle(n/5))

结果应该是大致在中间的东西。一个真正的第n个元素算法可能会使用类似上面的东西,然后在之后清理它以找到实际的第n个元素。

n=5,你得到了中间。

n=25,你得到短序列中间的中间位置。这将大于每个短序列中的所有较小序列,或者至少第9个元素,不超过第16个元素,或者距离边缘36%。

n=125,你得到每个短序列中间的粗略中间。这至少是第9中间,所以有8 * 3 + 2 = 26个元素比粗糙的中间要少,或者距离边缘20.8%。

n=625,你得到每个短序列中间的粗略中间。这至少是第26中间,所以有77个元素比粗糙的中间要少,或者距离边缘有12%。

n=5^k,你会得到5^(k-1)粗糙中段的粗糙中间部分。如果5^k序列的粗略中间是r(k),那么r(k+1) = r(k)*3-1 ~ 3^k

3^k在O符号中的增长速度低于5 ^ k。

3^log_5(n)
= e^( ln(3) ln(n)/ln(5) )
= n^(ln(3)/ln(5))
=~ n^0.68

是对rough_middle元素序列的n最终结束位置下限的粗略估计。

理论上,可能需要大约n^0.33次减少迭代才能达到单个元素,这实际上并不是那么好。 (n ^ 0.68中的位数是n中位数的~0.68倍。如果我们在每个粗糙的中间区域刮掉那么多,我们需要在n中消耗大约n^0.33次位数所有位 - 更多,因为当我们从n中减去时,下一个n会从中减去稍微小的值。)

我见过的第n个元素解决方案的解决方法是在每个级别进行分区和修复:而不是递归到rough_middle,然后递归到middle。然后保证中位数的真正中间非常接近序列的实际中间位置,并且你可以找到真实的中间位置"相对较快(以O符号表示)。

当有更多元素时,我们可以通过更精确的rough_middle迭代来优化这个过程,但从不强迫它成为实际的中间元素?结束n越大,越接近中间,我们需要递归调用到中间,最终结果合理地接近中间。

但实际上,你的序列是一个非常糟糕的序列,实际上需要n ^ 0.33步才能将其分解为空的概率可能非常低。有点像快速排序问题:3个元素的中位数通常足够好。

快速统计分析。

随机挑选5个元素,然后选择中间元素。

The median index of a set of 2m+1 random sample of a uniform distribution follows the beta distribution with parameters of roughly (m+1, m+1),可能有一些非[0,1]间隔的缩放因子。

中位数的平均值显然为1/2。方差是:

(3*3)^2 / ( (3+3)^2 (3+3+1) )
= 81 / (36 * 7)
=~ 0.32

找出下一步超出了我的统计数据。我会作弊。

如果我们想象从平均值为0.5且方差为0.32的一组项中取中位数索引元素与平均其索引一样好......

n现在是我们原始集合中的元素数量。

然后,短序列的中值指数之和平均为n次n / 5 * 0.5 = 0.1 * n^2。短序列中值指数之和的方差是n次n / 5 * 0.32 = 0.064 * n^2

如果我们将值除以n / 5,我们得到:

n / 2的均值和1.6的方差。

哦,如果那是真的,那就太棒了。不随n大小增长的方差意味着当n变大时,短序列的中位数的平均索引变得非常紧密地分布。我想这有点道理。可悲的是,我们并没有这样做 - 我们希望分配短序列的中位数的伪中位数。这几乎肯定更糟。

实施细节。我们可以用对数的内存开销做一个就地粗略中位数。 (我们甚至可以在没有内存开销的情况下做到这一点!)

我们维持一个5个索引的向量,其中"此处没有任何内容"占位符。

每个都是一个连续的层。

在每个元素处,我们推进底部索引。如果它已满,我们抓住中位数,然后将其插入上一层,并清除底层。

最后,我们完成了。

using target = std::pair<size_t,std::array<size_t, 5>>;
bool push( target& t, size_t i ) {
  t.second[t.first]=i;
  ++t.first;
  if (t.first==5)
    return true;
}
template<class Container>
size_t extract_median( Container const& c, target& t ) {
  Assert(t.first != 0);
  std::sort( t.data(), t.data()+t.first, [&c](size_t lhs, size_t rhs){
    return c[lhs]<c[rhs];
  } );
  size_t r = t[(t.first+1)/2];
  t.first = 0;
  return r;
}
template<class Container>
void advance(Container const& c, std::vector<target>& targets, size_t i) {
  size_t height = 0;
  while(true) {
    if (targets.size() <= height)
      targets.push_back({});
    if (!push(targets[height], i))
      return;
    i = extract_median(c, targets[height]);
  }
}
template<class Container>
size_t collapse(Container const& c, target* b, target* e) {
  if (b==e) return -1;
  size_t before = collapse(c, b, e-1);
  target& last = (*e-1);
  if (before!=-1)
    push(before, last);
  if (last.first == 0)
    return -1;
  return extract_median(c, last);
}
template<class Container>
size_t rough_median_index( Container const& c ) {
  std::vector<target> targets;
  for (auto const& x:c) {
    advance(c, targets, &x-c.data());
  }
  return collapse(c, targets.data(), targets.data()+targets.size());
}

概述了它如何在随机访问容器上起作用。

答案 1 :(得分:2)

如果您有更多的查询而不是vector的插入,您可以考虑使用在插入时排序的数据结构 - 例如std::set - 然后使用std::advance()来获取按顺序排列的第n个元素。