问题:
这是LeetCode的一个问题:
给定一个整数数组,返回所有的第k个最小距离 对。一对(A,B)的距离定义为绝对值 A和B之间的差异。
示例:
Input:
nums = [1,3,1]
k = 1
Output: 0
Explanation:
Here are all the pairs:
(1,3) -> 2
(1,1) -> 0
(3,1) -> 2
Then the 1st smallest distance pair is (1,1), and its distance is 0.
我的问题
我用天真的方法解决了它(n ^ 2)基本上我找到了所有距离然后对它进行排序然后找到最小的第k个。 现在这是一个更好的解决方案。这不是我在leetcode论坛上找到的代码。但我无法理解代码的关键部分。
下面的代码基本上是进行二进制搜索。 low
是最小距离,high
是最大距离。像通常的二分搜索一样计算mid
。然后它countPairs(a, mid)
找到绝对差值小于或等于mid
的对的数量。然后相应地调整low
和high
。
但为什么二进制搜索结果必须是其中一个距离?首先,low
和high
来自数组,但是mid
,由他们计算,可能不是距离。最后,我们返回low
,其值在mid + 1
的二进制搜索基础上发生变化。为什么mid + 1
保证是距离之一?
class Solution {
// Returns index of first index of element which is greater than key
private int upperBound(int[] a, int low, int high, int key) {
if (a[high] <= key) return high + 1;
while (low < high) {
int mid = low + (high - low) / 2;
if (key >= a[mid]) {
low = mid + 1;
} else {
high = mid;
}
}
return low;
}
// Returns number of pairs with absolute difference less than or equal to mid.
private int countPairs(int[] a, int mid) {
int n = a.length, res = 0;
for (int i = 0; i < n; i++) {
res += upperBound(a, i, n - 1, a[i] + mid) - i - 1;
}
return res;
}
public int smallestDistancePair(int a[], int k) {
int n = a.length;
Arrays.sort(a);
// Minimum absolute difference
int low = a[1] - a[0];
for (int i = 1; i < n - 1; i++)
low = Math.min(low, a[i + 1] - a[i]);
// Maximum absolute difference
int high = a[n - 1] - a[0];
// Do binary search for k-th absolute difference
while (low < high) {
countPairs(a, mid)
if (countPairs(a, mid) < k)
low = mid + 1;
else
high = mid;
}
return low;
}
}
答案 0 :(得分:1)
这种类型的二进制搜索将找到 first 值x,其countPairs(a,x)&gt; = k。 (topcoder tutorial很好地解释了这一点。)
因此当函数以最终值为低时终止时,我们知道当距离从低-1变为低时,对的数量会发生变化,因此必须有一对距离较低的对。
例如,假设我们的目标为100并且知道:
var lineManagerId = db.Employees
.Where(x => x.FirstName == LineManagerId)
.Select(x =>x.Id)
// returns first value or default, i.e. 0 for int, null for string
.FirstOrDefault();
必须有一对距离恰好为10的数字,因为如果没有这样的对,那么距离小于或等于10的对的数量将与距离小于或小于的对的数量相同等于9。
请注意,这仅适用于循环运行,直到测试间隔完全耗尽为止。如果代码使用了提前终止条件,如果找到了确切的目标值则退出循环,那么它可能会返回错误的答案。
答案 1 :(得分:0)
出于兴趣,我们可以在O(n log n + m log m)
时间内解决此问题,其中m
是范围,使用快速傅里叶变换。
首先对输入进行排序。现在考虑通过从另一个中减去一个差异前缀和,可以实现数字之间可达到的每个距离。例如:
input: 1 3 7
diff-prefix-sums: 2 6
difference between 7 and 3 is 6 - 2
现在让我们将等式(最右边的前缀和)添加到等式的每一边:
ps[r] - ps[l] = D
ps[r] + (T - ps[l]) = D + T
让我们列出差异:
1 1 3
0 2
和前缀sums:
p => 0 0 2
T - p => 2 2 0 // 2-0, 2-0, 2-2
我们需要有效地确定和排序所有不同可实现差异的计数。这类似于将多项式与系数[1, 0, 2]
乘以具有系数[2, 0, 0]
的多项式(我们不需要第二组中的零系数,因为它只生成小于或等于的度数T
),我们可以在m log m
时间内完成,其中m
是度,使用快速傅立叶变换。
结果系数为:
1 0 2
*
2 0 0
=>
x^2 + 2
*
2x^2
= 2x^4 + 4x^2
=> 2 0 4 0 0
我们丢弃低于T
的度数,并显示我们的有序结果:
2 * 4 = 2 * (T + 2) => 2 diffs of 2
4 * 2 = 4 * (T + 0) => 4 diffs of 0
我们超过了0的差异。也许有一种方便的方法来计算某人可能建议的零过量。我花了一些时间,但尚未区分其中一个。
在任何情况下,使用不相交的重复计数都可以轻松获得零差异计数,这使我们仍然可以在k
总时间内返回O(n log n + m log m)
差异。