以相反的顺序获取`std :: priority_queue`元素?

时间:2012-02-24 20:24:06

标签: c++ priority-queue stl-algorithm knn

我编写了一些K-nearest-neighbor查询方法,这些方法构建了一个最接近给定查询点的点列表。为了维护该邻居列表,我使用std::priority_queue使得top元素是查询点的最远邻居。这样我知道是否应该推送当前正在检查的新元素(如果距离当前最远的邻居的距离较小),并且当我的优先级队列具有多于K个元素时,可以弹出()最远的元素。

到目前为止,一切都很顺利。但是,当我输出元素时,我想从最接近最远的位置订购它们。目前,我只是从优先级队列中弹出所有元素并将它们放在输出容器上(通过迭代器),从而产生从最远到最近排序的一系列点,然后,我调用std::reverse在输出迭代器范围内。

作为一个简单的例子,这里是一个使用优先级队列的线性搜索(显然,我使用的实际最近邻查询方法要复杂得多):

  template <typename DistanceValue,
            typename ForwardIterator,
            typename OutputIterator,
            typename GetDistanceFunction,
            typename CompareFunction>
  inline 
  OutputIterator min_dist_linear_search(ForwardIterator first,
                                        ForwardIterator last,
                                        OutputIterator output_first,
                                        GetDistanceFunction distance,
                                        CompareFunction compare,
                                        std::size_t max_neighbors = 1,
                                        DistanceValue radius = std::numeric_limits<DistanceValue>::infinity()) {
    if(first == last) 
      return output_first;

    typedef std::priority_queue< std::pair<DistanceValue, ForwardIterator>, 
                                 std::vector< std::pair<DistanceValue, ForwardIterator> >,
                                 detail::compare_pair_first<DistanceValue, ForwardIterator, CompareFunction> > PriorityQueue; 

    PriorityQueue output_queue = PriorityQueue(detail::compare_pair_first<DistanceValue, ForwardIterator, CompareFunction>(compare));

    for(; first != last; ++first) {
      DistanceValue d = distance(*first);
      if(!compare(d, radius)) 
        continue;

      output_queue.push(std::pair<DistanceValue, ForwardIterator>(d, first));

      while(output_queue.size() > max_neighbors)
        output_queue.pop();

      if(output_queue.size() == max_neighbors)
        radius = output_queue.top().first;
    };

    OutputIterator it = output_first;
    while( !output_queue.empty() ) {
      *it = *(output_queue.top().second);
      output_queue.pop(); ++it;
    };
    std::reverse(output_first, it);
    return it;
  };

除了一件事之外,上面都是花花公子:它要求输出迭代器类型是双向的,并且基本上指向预先分配的容器。现在,将输出存储在某些输出迭代器规定的范围内的这种做法非常好并且非常标准(例如std::copy和其他STL算法就是很好的例子)。但是,在这种情况下,我希望能够只需要一个正向输出迭代器类型,这样就可以使用像STL容器和iostreams那样的后插件迭代器。

因此,这归结为在在输出迭代器中转储其内容之前反转优先级队列。所以,这些是我能够提出的更好的选择:

  • 创建std::vector,在其中转储优先级队列内容,并使用向量上的反向迭代器将元素转储到output-iterator中。

  • std::priority_queue替换为已排序的容器(例如std::multimap),然后使用相应的遍历顺序将内容转储到输出迭代器中。

还有其他合理的选择吗?

我曾经在此算法的先前实现中使用std::multimap和其他人,如上面的第二个选项。但是,当我切换到std::priority_queue时,性能提升非常显着。所以,我宁愿不使用第二个选项,因为看起来使用优先级队列来维护邻居列表比依赖排序数组要好得多。顺便说一下,我还尝试了一个std::vector,我用std::inplace_merge排序,这比多图更好,但是与优先级队列不匹配。

至于第一个选项,这是我此时的最佳选择,我不得不进行双重数据传输(queue - &gt; vector - &gt; output)。我只是倾向于认为必须有一种更简单的方法来做这件事......我缺少的东西......

第一个选项在这个应用程序中确实并不坏(考虑到它之前的算法的复杂性),但如果有一个技巧可以避免这种双内存传输,我想知道它。 / p>

3 个答案:

答案 0 :(得分:5)

问题解决了!

我是个白痴......我知道我错过了一些明显的东西。在这种情况下,std::sort_heap()功能。 reference page甚至有一个例子可以完全满足我的需要(因为std::priority_queue只是根据随机访问容器和堆函数(pop_heap,push_heap,make_heap)来实现的。直接使用这些函数代替std::priority_queue类没有真正的区别。我不知道怎么会错过那个。

无论如何,我希望这可以帮助那些遇到同样问题的人。

答案 1 :(得分:3)

一个肮脏的想法,但仍然可以保证起作用,如下:

std::priority_queue<int, std::vector<int>, std::less<int> > queue;
queue.push(3);
queue.push(5);
queue.push(9);
queue.push(2);

// Prints in reverse order.
int* front = const_cast<int*>(&queue.top());
int* back = const_cast<int*>(front + queue.size());
std::sort(front, back);
while (front < back) {
    printf("%i ", *front);
    ++front;
}

可能会注意到就地排序可能会破坏队列。

答案 2 :(得分:3)

为什么不在声明中指定相反的比较函数:

#include <iostream>
#include <queue>
#include <vector>
#include <functional>

int main() {
    std::priority_queue<int, std::vector<int>, std::greater<int> > pq;
    pq.push(1);
    pq.push(10);
    pq.push(15);
    std::cout << pq.top() << std::endl;
}