这是我的一个朋友作为他的家庭作业(在算法和数据结构类中)收到的问题。他问我这件事。但是,我无法解决它,并且在过去的几天里一直在考虑它。
在[0,2 31 -1]范围内有 n 随机整数(可能有重复。确定这些数字的3个数是否满足 A + B = C 。
我首先提出了一个天真的算法,即O( n 2 log n )。 然后我想出了一个算法,即O( n 2 )。这是伪代码:
sort(a); // non-descending
for (i = 0; i < n; i++) {
j = i; k = i + 1;
while (j < n && k < n) {
if (a[i] + a[j] == a[k])
return true;
else if (a[i] + a[k] < a[j])
k++;
else
j++;
}
}
return false;
然而,该问题表明1&lt; n &lt; = 10 6 。我相信O( n 2 )太慢了。我的解决方案没有利用随机性。但是,我不确定这是否是问题的重要部分。
答案 0 :(得分:13)
一般问题是3SUM-Hard,是否存在优于二次算法的问题是开放的。
因此,如果您需要更快的算法,您可能需要利用它们是32位的事实。
答案 1 :(得分:3)
如果数字是随机的,那么任何最坏情况的O(n^2)
算法(包括你的算法)都会非常快。事实上,实际复杂性将是 O(n*logn)
(排序的复杂性)。
这很像quicksort,我们的平均值O(n*logn)
和点击O(n^2)
的可能性很小。
10^6
随机数给我们~ 10^6*10^6
'几乎随机'的范围~ 0..10^9
中的和。那些10^12
随机和中的一个是否等于整数范围内给定随机值的几率是多少?非常好。
现在,那些10^12
随机总和中的一个是否等于给定随机值的 10 ^ 6 之一的概率是多少? 100%,诗意地说。
我已经实现了您提出的解决方案,n = 10^6
它在最内层循环中执行平均5000-10000
次操作。对于O(n^2)
来说太多了。排序是最昂贵的操作。
PS。如果更新解决方案以使用哈希而不是排序,则可以进一步降低复杂性并使其均匀O(1)
。
PS 2. java中的测试程序,供参考。运行它,亲眼看看。
int n = 1000000;
int[] a = new int[n];
// generate random array
Random r = new Random();
for (int i = 0; i < n; ++i) {
do {
a[i] = r.nextInt();
} while (a[i] < 0);
}
Arrays.sort(a);
// number of operations inside main loop
int ops = 0;
// main logic, pretty much as OP described it
boolean found = false;
for (int i = 0; i < n && !found; ++i) {
int j = i;
int k = i + 1;
while (k < n) {
++ops;
if (a[i] > a[k] - a[j]) {
++k;
} else if (a[i] < a[k] - a[j]) {
++j;
} else {
System.out.println(a[i] + " + " + a[j] + " = " + a[k]);
found = true;
break;
}
}
}
System.out.println(ops);
答案 2 :(得分:2)
使用散列的算法在Python中需要10-900 微秒(平均值:200中位数:60):
#!/usr/bin/env python
import random
L = frozenset(random.sample(xrange(2**31), 10**6))
print next(((a,b,a+b) for a in L for b in L if (a + b) in L), None)
它是O(N**2)
,但它似乎足够快。
为了进行比较,创建O(N)
的摊销frozenset
操作需要270
毫秒(比搜索慢1000倍)并创建随机列表需要0.9
秒。
注意:如果输入序列包含唯一元素,random.sample
不返回重复元素,因此frozenset
不会丢弃上例中的任何元素。为了解决允许重复元素的随机序列的问题,我们应该使用两个数据结构:
#!/usr/bin/env python
import random
L = [random.randrange(2**31) for _ in xrange(10**6)]
S = frozenset(L)
print len(L), len(S)
print next(((a, b, a+b) for a in L for b in L if (a + b) in S), None)
1000000 999762
(2055933464, 83277289, 2139210753)
答案 3 :(得分:1)
在对排序列表进行测量时,我得到O(n log n):
from bisect import bisect_right
import cProfile as prof
import random
def find3sum(T):
if len(T) < 3:
return None
n = len(T)
top = T[-1]
for i in range(len(T)-1):
b = top - T[i]
if b < T[i]:
return None
k = bisect_right(T, b, i, n-1)
while k > i:
c = T[i] + T[k]
j = bisect_right(T, c, k, n-1)
if j <= k:
break
elif T[j] == c:
return (i, k, j)
else:
k -= 1
def test_one(a):
a = sorted(a)
r = find3sum(a)
i, k , j = r
assert a[i] + a[k] == a[j]
def test():
n = 100000
max = 200000
random.seed(0)
for _ in range(100):
a = [random.randint(0,max) for _x in xrange(n)]
test_one(a)
a = range(n)
test_one(a)
prof.run('test()')
这些是结果(关于每个元素的一次调用):
ncalls tottime percall cumtime percall filename:lineno(function)
1 0.002 0.002 183.764 183.764 <string>:1(<module>)
200 0.005 0.000 89.996 0.450 find2sum.py:25(test_one)
1 17.269 17.269 183.762 183.762 find2sum.py:31(test)
200 35.096 0.175 79.601 0.398 find2sum.py:5(find3sum)
10000000 44.958 0.000 52.398 0.000 random.py:160(randrange)
10000000 23.891 0.000 76.289 0.000 random.py:224(randint)
1 0.000 0.000 0.000 0.000 random.py:99(seed)
19599982 44.077 0.000 44.077 0.000 {_bisect.bisect_right}
1 0.000 0.000 0.000 0.000 {function seed at 0x9a1972c}
600 0.001 0.000 0.001 0.000 {len}
1 0.000 0.000 0.000 0.000 {method 'disable' of '_lsprof.Profiler' objects}
10000000 7.440 0.000 7.440 0.000 {method 'random' of '_random.Random' objects}
301 0.635 0.002 0.635 0.002 {range}
200 10.390 0.052 10.390 0.052 {sorted}
有几种优化可以大大减少运行时间(比如跳过等于已经测试过的数字的运行)。
答案 4 :(得分:-1)
A + B = C,因此 B = C-A或A = C-B
使用哈希表可以在O(n)复杂度中完成上述问题。
var C; // the sum you are looking for
for(each element)
X = C - element
boolean exists = lookup for X in hash table
if (exists) combination A+B=C exists in the given input
else hashtable.put(element)
希望有所帮助。