Question

似乎存在八种二分搜索变体（按升序给出排序列表）：

最大数量小于目标（但最重复的是）
最大数量小于目标（但最重要的是重复）
小于或等于目标的最大数字（但最重要的是重复数据）
小于或等于目标的最大数字（但最重要的是重复数据）
大于目标的最小数字（但最重要的是重复数字）
大于目标的最小数字（但最重要的是重复数字）
大于或等于目标的最小数字（但最重要的是重复数字）
大于或等于目标的最小数字（但最重要的是重复数字）

我如何知道如何正确和逻辑地为这些设置正确的二进制搜索类型？每当我尝试时，似乎逻辑在列表变得非常小或者出现奇怪的边缘情况时会失败，这让我觉得我的逻辑错误。

有没有更好的方法来逻辑地考虑这种问题，以便更好地设置二进制搜索？

您总是会听到很高比例的程序员如何能够正确地编写二进制搜索代码，但是我发现没有关于如何正确设置的详尽文献，我一点也不感到惊讶这8例。

Answer 1

我用于二元搜索的心理模型如下：假设我们有一个单调递增的函数f：[a，b] - ＆gt; {0,1}并且我们希望从[a，b]中找到f（i）= 1的最小数字i，或者如果不存在这样的数字则找到b。以下算法将计算该结果：

lo = a, hi = b
while lo < hi:
    # invariant: lo <= i <= hi
    mid = (lo + hi)/2  # or lo + (hi - lo) / 2 to avoid overflows
    if f(mid): 
        hi = mid
    else: 
        lo = mid + 1

最后，lo = hi = i。

有趣的是，这段代码永远不会检查f（b），所以如果只在[a，b-1]上定义f就没问题。如果f（b-1）= 0，则代码将报告b作为答案。只需使用正确的函数f，就可以涵盖使用此功能提到的所有情况。例如：

（7）大于或等于目标的最小数字（但最重要的是最重要的）

假设您有一个大小为n的数组。

使用a = 0，b = n，f（i）= array [i]＆gt; = target

（1）最大数量小于目标（但最重要的是重复）

使用a = -1，b = n - 1，f（i）=（array [i + 1]＆gt; = target）。

或者，使用（7）的解决方案并减去1.应该清楚的是，我们在这里只将1移动了一切。

（2）最大数量小于目标（但最重复的是）

如果我没弄错的话，这需要两次搜索。您可以使用case（1）的解决方案（比如索引i），然后使用a = 0，b = i，f（j）= array [j] == array [i]来找到最左边的副本。

等

我认为自从我开始使用这种模式后，我从未犯过二进制搜索错误。

如何逻辑解释二进制搜索的任何变体

1 个答案: