曼哈顿公制的最小距离

时间:2016-08-27 17:05:44

标签: c++ algorithm optimization

我试图找到Manhattan metric(x,y)中的最小距离。我正在寻找有关此事的信息。但我还没找到任何东西。

#include<bits/stdc++.h>
using namespace std;
#define st first
#define nd second

pair<int, int> pointsA[1000001];
pair<int, int> pointsB[1000001];

int main() {
    int n, t;
    unsigned long long dist;

    scanf("%d", &t);

    while(t-->0) {
        dist = 4000000000LL;
        scanf("%d", &n);

        for(int i = 0; i < n; i++) {
            scanf("%d%d", &pointsA[i].st, &pointsA[i].nd);
        }

        for(int i = 0; i < n; i++) {
            scanf("%d%d", &pointsB[i].st, &pointsB[i].nd);
        }

        for(int i = 0; i < n ;i++) {
            for(int j = 0; j < n ; j++) {
                if(abs(pointsA[i].st - pointsB[j].st) + abs(pointsA[i].nd - pointsB[j].nd) < dist) {
                    dist = abs(pointsA[i].st - pointsB[j].st) + abs(pointsA[i].nd - pointsB[j].nd);
                }
            }
            printf("%lld\n", dist);
        }
    }
}

我的代码在O(n ^ 2)中工作,但速度太慢。我不知道它是否有用但y在点A总是&gt;点B中的0和y总是&lt;我的代码实际比较了与下一个的距离并选择了最小的。

例如:

输入:

2
3
-2 2
1 3
3 1
0 -1
-1 -2
1 -2
1
1 1
-1 -1

输出:

5
4

4 个答案:

答案 0 :(得分:2)

我的解决方案(为简单起见,我不关心manhattan_dist中的溢出,因此它不适用于unsigned long long):

#include <cstdlib>
#include <cstdio>
#include <cassert>
#include <vector>
#include <limits>
#include <algorithm>

typedef std::pair<int, int> Point;
typedef std::vector<std::pair<int, int> > PointsList;

static inline bool cmp_by_x(const Point &a, const Point &b)
{
    if (a.first < b.first) {
        return true;
    } else if (a.first > b.first) {
        return false;
    } else {
        return a.second < b.second;
    }
}

static inline bool cmp_by_y(const Point &a, const Point &b)
{
    if (a.second < b.second) {
        return true;
    } else if (a.second > b.second) {
        return false;
    } else {
        return a.first < b.first;
    }
}

static inline unsigned manhattan_dist(const Point &a, const Point &b)
{
    return std::abs(a.first - b.first) +
        std::abs(a.second - b.second);
}

int main()
{
    unsigned int n_iter = 0;
    if (scanf("%u", &n_iter) != 1) {
        std::abort();
    }
    for (unsigned i = 0; i < n_iter; ++i) {
        unsigned int N = 0;
        if (scanf("%u", &N) != 1) {
            std::abort();
        }
        if (N == 0) {
            continue;
        }
        PointsList pointsA(N);
        for (PointsList::iterator it = pointsA.begin(), endi = pointsA.end(); it != endi; ++it) {
            if (scanf("%d%d", &it->first, &it->second) != 2) {
                std::abort();
            }
            assert(it->second > 0);
        }
        PointsList pointsB(N);
        for (PointsList::iterator it = pointsB.begin(), endi = pointsB.end(); it != endi; ++it) {
            if (scanf("%d%d", &it->first, &it->second) != 2) {
                std::abort();
            }
            assert(it->second < 0);
        }

        std::sort(pointsA.begin(), pointsA.end(), cmp_by_y);
        std::sort(pointsB.begin(), pointsB.end(), cmp_by_y);
        const PointsList::const_iterator min_a_by_y = pointsA.begin();
        const PointsList::const_iterator max_b_by_y = (pointsB.rbegin() + 1).base();
        assert(*max_b_by_y == pointsB.back());

        unsigned dist = manhattan_dist(*min_a_by_y, *max_b_by_y);
        const unsigned diff_x = std::abs(min_a_by_y->first - max_b_by_y->first);
        const unsigned best_diff_y = dist - diff_x;

        const int max_y_for_a = max_b_by_y->second + dist;
        const int min_y_for_b = min_a_by_y->second - dist;
        PointsList::iterator it;
        for (it = pointsA.begin() + 1; it != pointsA.end() && it->second <= max_y_for_a; ++it) {
        }
        if (it != pointsA.end()) {
            pointsA.erase(it, pointsA.end());
        }

        PointsList::reverse_iterator rit;
        for (rit = pointsB.rbegin() + 1; rit != pointsB.rend() && rit->second >= min_y_for_b; ++rit) {
        }
        if (rit != pointsB.rend()) {
            pointsB.erase(pointsB.begin(), (rit + 1).base());
        }
        std::sort(pointsA.begin(), pointsA.end(), cmp_by_x);
        std::sort(pointsB.begin(), pointsB.end(), cmp_by_x);

        for (size_t j = 0; diff_x > 0 && j < pointsA.size(); ++j) {
            const Point &cur_a_point = pointsA[j];
            assert(max_y_for_a >= cur_a_point.second);
            const int diff_x = dist - best_diff_y;
            const int min_x = cur_a_point.first - diff_x + 1;
            const int max_x = cur_a_point.first + diff_x - 1;

            const Point search_term = std::make_pair(max_x, std::numeric_limits<int>::min());
            PointsList::const_iterator may_be_near_it = std::lower_bound(pointsB.begin(), pointsB.end(), search_term, cmp_by_x);

            for (PointsList::const_reverse_iterator rit(may_be_near_it); rit != pointsB.rend() && rit->first >= min_x; ++rit) {
                const unsigned cur_dist = manhattan_dist(cur_a_point, *rit);
                if (cur_dist < dist) {
                    dist = cur_dist;
                }
            }
        }
        printf("%u\n", dist);
    }
}

我的机器上的基准测试(Linux + i7 2.70 GHz + gcc -Ofast -march = native):

$ make bench
time ./test1 < data.txt  > test1_res

real    0m7.846s
user    0m7.820s
sys     0m0.000s
time ./test2 < data.txt  > test2_res

real    0m0.605s
user    0m0.590s
sys     0m0.010s

test1是您的变体,test2是我的。

答案 1 :(得分:1)

您需要学习如何编写函数以及如何使用容器。根据您当前的编码风格,获得更好的解决方案是不可行的。

问题是更好的解决方案是递归方法。按X坐标对点进行排序。现在递归地将该组分成两半并确定每一半内的最近距离以及来自任一半的一对点之间的最近距离。

最后一部分是有效的,因为两个半部都按X排序。比较左半部分的最后一个值和右半部分的第一个值给出了一个很好的距离上限。

答案 2 :(得分:0)

因此,您可以进行真正的简单优化,可以减少大量时间。

由于您声明集合A中的所有点都具有y&gt; 0,并且组B中的所有点都具有y <0。 0,你可以立即丢弃A中y&gt;的所有点。心灵主义者和B中的所有点,其中y < - 到目前为止。这些点永远不会比当前最近的一对更接近:

for(int i = 0; i < n ;i++) {
    if (pointsA[i].nd > dist)
        continue; // <- this is the big one
    for(int j = 0; j < n ; j++) {
        if (pointsB[j].nd < -dist)
            continue; // <- helps although not as much
        if(abs(pointsA[i].st - pointsB[j].st) + abs(pointsA[i].nd - pointsB[j].nd) < dist) {
            dist = abs(pointsA[i].st - pointsB[j].st) + abs(pointsA[i].nd - pointsB[j].nd);
        }
    }
    printf("%lld\n", dist);
}

对于每组40000点的测试,在我的机器上使用gcc和-O2,这会将时间从8.2秒减少到大致 0.01秒(并产生正确的结果)! (在Windows上用QueryPerformanceCounter衡量)。

不要太破旧。

Fwiw,两次计算你的距离实际上并不是什么大不了的事。首先,&#34;第二&#34;计算实际上并非经常发生,只有在找到更近的距离时才会发生。

其次,由于我无法解释的原因,将其存储在一个变量中并且只计算一次实际上一致似乎增加了约20%的总运行时间,将其从平均8.2秒提高到约上述设置为10.5秒。

我说根据您对Y值的假设而丢弃积分是迄今为止您可以获得的最大爆炸点,而不会显着改变您的算法。

您可以通过按照增加A的Y值和减少B的Y值的顺序预先排序A和B来进一步利用这一点,然后找到距离,以最大限度地跳过后续点的机会集。

答案 3 :(得分:0)

保留A组和B组中的候选人列表,最初包含整个输入。将y和最大y的最小值取为y中最接近的对,计算曼哈顿距离,并消除任何y大于候选列表的上限。这可能会削减输入,或者它可能基本上没有效果,但它是O(N)并且是便宜的第一步。

现在按x和y对剩余的候选人进行排序。这给出了y中的单独列表,以及x中的混合列表,并且是O(N log N),其中N已被减少,希望但不一定是第1步。 对于每个点,现在计算其在y(平凡)中最接近的邻居并且在x中更接近(稍微更难),然后计算其最小可能曼哈顿距离,假设x中最接近的也是y中最接近的。消除距离候选人名单的界限以外的任何点数。现在再次排序,尽可能最小化。这是另一个N log N操作。 现在从最佳候选者开始,通过尝试x或y中任一方向上的最近点,并在delta x或delta y超过最佳值到目前为止,或者delta x或delta y超过时终止,找到它的真正最小距离你的最大限度。如果您有更好的候选对,那么当前候选对,清除可能最差的所有内容的候选列表。如果最佳候选点不构成候选对的一半,则只需清除那一点。

当您清除了一定数量的候选人时,重新计算列表。我不确定最好的价值是什么,当然如果你找到最差的候选人,你必须做到这一点然后再次开始。也许使用50%。

最终你只剩下一对候选人。我不太清楚分析是什么 - 最坏的情况我认为你在每次测试中只消除了一些候选人。但是对于大多数输入,你应该很快将候选列表降低到一个很小的值。