使用std :: nth_element时,第n个元素的重复是否总是连续的?

时间:2015-05-21 09:08:30

标签: c++ sorting contiguous quickselect nth-element

vector<int> data = {3, 1, 5, 3, 3, 8, 7, 3, 2}; 
std::nth_element(data.begin(), data.begin() + median, data.end());

这总是会导致:

data = {less, less, 3, 3, 3, 3, larger, larger, larger} ?

或者其他可能的结果是:

data = {3, less, less, 3, 3, 3, larger, larger, larger} ?

我已经在我的机器上多次尝试过,导致第n个值始终是连续的。但那不是证明;)。

它的用途:

我想构建一个独特的Kdtree,但我的向量中有重复项。目前我正在使用nth_element来查找中值。问题是选择一个唯一/可重构的中位数,而不必再次遍历向量。如果中值是连续的,我可以选择一个独特的中位数,而不需要太多遍历。

2 个答案:

答案 0 :(得分:1)

我刚刚尝试了几个不那么简单的例子,而第三个例子得到了非连续的输出。

程序

#include <vector>
#include <iostream>
#include <algorithm>

int main() {
   std::vector<int> a = {1, 3, 3, 2, 1, 3, 5, 5, 5, 5};
   std::nth_element(a.begin(), a.begin() + 5, a.end());
   for(auto v: a) std::cout << v << " ";
   std::cout << std::endl;
}

使用gcc 4.8.1在Linux下使用std=c++11,为我提供输出

3 1 1 2 3 3 5 5 5 5

而第n个元素是3。

所以不,元素并不总是连续的。

我还认为,即使是更简单的方法,也没有考虑好的测试用例,只是生成具有许多重复元素的长随机数组并检查它是否成立。我认为它会在第一次或第二次尝试时中断。

答案 1 :(得分:1)

没有。 documentation没有指定这样的行为,只需几分钟的实验,很容易找到一个测试用例,其中欺骗在ideone上不连续:

#include <iostream>
#include <algorithm>

int main() {
    int a[] = {2, 1, 2, 3, 4};
    std::nth_element(a, a+2, a+5);
    std::cout << a[1];
    return 0;
}

输出:

1

如果欺骗是连续的,那么输出就是2