快速搜索以查找有效范围

时间:2018-01-18 07:02:29

标签: c++ algorithm c++11 binary-search

我有一系列数字(实际上我们说它们是1� 000' 000)。每个范围都有一个下限和一个上限。我使用了一种排序(实际上是快速排序)功能来对它们进行排序。

现在给出一个点0.3,我想找到包含这个数字的所有范围。我寻找一种有效的方法来找到这些有效范围。我不确定upper_boundlower_bound是否是正确的解决方案。有人可以帮我完成这段代码吗?

P.S。假设数组长度很大,我寻找一种利用有序向量优势的方法。

P.S。重叠的层在500的范围内。没有1'000'000那么大。

P.S。总是,min <= max(如果重要的话)。

ranges

#include <vector>
#include <iostream>
#include <algorithm>

class Range
{
public:
    double min;
    double max;
};

int main()
{
    std::vector<Range> range_list
        {
            {0.020742,0.460304},
            {0.168229,0.274032},
            {0.174609,0.420922},
            {0.352116,0.660738},
            {0.445867,0.910085},
            {0.249047,0.794357},
            {0.264342,0.953567},
            {0.671572,0.823919},
            {0.424151,0.891832},
            {0.041007,0.515920}
        };
    std::vector<int> min_list;
    std::vector<int> max_list;
    min_list.resize(range_list.size());
    for(int i=0;i<(int)range_list.size();i++)
        min_list[i]=i;
    max_list=min_list;
    std::sort(
        min_list.begin(),
        min_list.end(),
        [&range_list](int i,int j)
        {
            return range_list[i].min<range_list[j].min;
        });
    std::sort(
        max_list.begin(),
        max_list.end(),
        [&range_list](int i,int j)
        {
            return range_list[i].max<range_list[j].max;
        });

    std::vector<int>::iterator ???,???;
    ???=std::lower_bound(min_list.begin(),
            range_list.end(), 0.3);
    ???= std::upper_bound(max_list.begin(),
            range_list.end(), 0.3);
    ????????????

    std::vector<int> active_range=...

    std::cout<<"Active ranges are:"<<std::endl;
    for(auto x: active_range)
        std::cout<<"("<<x.min<<","<<x.max<<")"<<std::endl;

    return 0;
}

2 个答案:

答案 0 :(得分:4)

您正在单独订购间隔的起点和终点。之后,您通过二分搜索丢弃一些间隔,但是您需要找到max_listmin_list之间的剩余间隔的交集。与线性搜索相比,这不是一个很大的改进。

有效的解决方案有点困难。有interval tree数据结构通常用于解决此类问题。它有O(n*log(n))个树创建的复杂性,O(log(n)+m)查询的复杂性m是结果的大小。

答案 1 :(得分:-1)

下限和上限是正确的方法。我不确定你要用min_list和max_list做什么,我会找出范围本身的排序然后直接搜索它们。