确定A + B = C是否存在于n个整数的数组中

时间:2011-01-30 12:41:02

标签: arrays algorithm integer linear-algebra

这是我的一个朋友作为他的家庭作业(在算法和数据结构类中)收到的问题。他问我这件事。但是,我无法解决它,并且在过去的几天里一直在考虑它。

在[0,2 31 -1]范围内有 n 随机整数(可能有重复。确定这些数字的3个数是否满足 A + B = C

我首先提出了一个天真的算法,即O( n 2 log n )。 然后我想出了一个算法,即O( n 2 )。这是伪代码:

sort(a); // non-descending
for (i = 0; i < n; i++) {
  j = i; k = i + 1;
  while (j < n && k < n) {
    if (a[i] + a[j] == a[k])
      return true;
    else if (a[i] + a[k] < a[j])
      k++;
    else
      j++;
  }
}
return false;

然而,该问题表明1&lt; n &lt; = 10 6 。我相信O( n 2 )太慢了。我的解决方案没有利用随机性。但是,我不确定这是否是问题的重要部分。

5 个答案:

答案 0 :(得分:13)

一般问题是3SUM-Hard,是否存在优于二次算法的问题是开放的。

因此,如果您需要更快的算法,您可能需要利用它们是32位的事实。

答案 1 :(得分:3)

如果数字是随机的,那么任何最坏情况的O(n^2)算法(包括你的算法)都会非常快。事实上,实际复杂性将是 O(n*logn) (排序的复杂性)。
这很像quicksort,我们的平均值O(n*logn)和点击O(n^2)的可能性很小。

10^6随机数给我们~ 10^6*10^6'几乎随机'的范围~ 0..10^9中的和。那些10^12随机和中的一个是否等于整数范围内给定随机值的几率是多少?非常好。
现在,那些10^12随机总和中的一个是否等于给定随机值的 10 ^ 6 之一的概率是多少? 100%,诗意地说。

我已经实现了您提出的解决方案,n = 10^6它在最内层循环中执行平均5000-10000次操作。对于O(n^2)来说太多了。排序是最昂贵的操作。

PS。如果更新解决方案以使用哈希而不是排序,则可以进一步降低复杂性并使其均匀O(1)

PS 2. java中的测试程序,供参考。运行它,亲眼看看。

    int n = 1000000;
    int[] a = new int[n];

    // generate random array
    Random r = new Random();
    for (int i = 0; i < n; ++i) {
        do {
            a[i] = r.nextInt();
        } while (a[i] < 0);
    }

    Arrays.sort(a);

    // number of operations inside main loop
    int ops = 0;

    // main logic, pretty much as OP described it
    boolean found = false;
    for (int i = 0; i < n && !found; ++i) {
        int j = i;
        int k = i + 1;
        while (k < n) {
            ++ops;

            if (a[i] > a[k] - a[j]) {
                ++k;
            } else if (a[i] < a[k] - a[j]) {
                ++j;
            } else {
                System.out.println(a[i] + " + " + a[j] + " = " + a[k]);
                found = true;
                break;
            }
        }
    }

    System.out.println(ops);

答案 2 :(得分:2)

使用散列的算法在Python中需要10-900 微秒(平均值:200中位数:60):

#!/usr/bin/env python
import random

L = frozenset(random.sample(xrange(2**31), 10**6))
print next(((a,b,a+b) for a in L for b in L if (a + b) in L), None)

它是O(N**2),但它似乎足够快。

为了进行比较,创建O(N)的摊销frozenset操作需要270 毫秒(比搜索慢1000倍)并创建随机列表需要0.9

注意:如果输入序列包含唯一元素,random.sample不返回重复元素,因此frozenset不会丢弃上例中的任何元素。为了解决允许重复元素的随机序列的问题,我们应该使用两个数据结构:

#!/usr/bin/env python
import random

L = [random.randrange(2**31) for _ in xrange(10**6)]
S = frozenset(L)
print len(L), len(S)
print next(((a, b, a+b) for a in L for b in L if (a + b) in S), None)

输出

1000000 999762
(2055933464, 83277289, 2139210753)

答案 3 :(得分:1)

在对排序列表进行测量时,我得到O(n log n):

from bisect import bisect_right
import cProfile as prof
import random

def find3sum(T):
    if len(T) < 3:
        return None
    n = len(T)
    top = T[-1]
    for i in range(len(T)-1):
        b = top - T[i]
        if b < T[i]:
            return None
        k = bisect_right(T, b, i, n-1)
        while k > i:
            c = T[i] + T[k]
            j = bisect_right(T, c, k, n-1)
            if j <= k:
                break
            elif T[j] == c:
               return (i, k, j)
            else:
               k -= 1

def test_one(a):
    a = sorted(a)
    r = find3sum(a)
    i, k , j = r
    assert a[i] + a[k] == a[j]

def test():
    n = 100000
    max = 200000
    random.seed(0)
    for _ in range(100):
        a = [random.randint(0,max) for _x in xrange(n)]
        test_one(a)
        a = range(n)
        test_one(a)

prof.run('test()')

这些是结果(关于每个元素的一次调用):

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.002    0.002  183.764  183.764 <string>:1(<module>)
      200    0.005    0.000   89.996    0.450 find2sum.py:25(test_one)
        1   17.269   17.269  183.762  183.762 find2sum.py:31(test)
      200   35.096    0.175   79.601    0.398 find2sum.py:5(find3sum)
 10000000   44.958    0.000   52.398    0.000 random.py:160(randrange)
 10000000   23.891    0.000   76.289    0.000 random.py:224(randint)
        1    0.000    0.000    0.000    0.000 random.py:99(seed)
 19599982   44.077    0.000   44.077    0.000 {_bisect.bisect_right}
        1    0.000    0.000    0.000    0.000 {function seed at 0x9a1972c}
      600    0.001    0.000    0.001    0.000 {len}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}
 10000000    7.440    0.000    7.440    0.000 {method 'random' of '_random.Random' objects}
      301    0.635    0.002    0.635    0.002 {range}
      200   10.390    0.052   10.390    0.052 {sorted}

有几种优化可以大大减少运行时间(比如跳过等于已经测试过的数字的运行)。

答案 4 :(得分:-1)

A + B = C,因此 B = C-A或A = C-B

使用哈希表可以在O(n)复杂度中完成上述问题。

var C; // the sum you are looking for
for(each element)
    X = C - element
    boolean exists = lookup for X in hash table
    if (exists) combination A+B=C exists in the given input
    else hashtable.put(element)

希望有所帮助。