Boyer-Moore多数投票算法的内存复杂性?

时间:2016-08-27 14:48:51

标签: java algorithm boyer-moore

根据我的理解,为了找到多数元素,Boyer-Moore多数投票算法是O(1),即它是常数并且与输入的大小不成比例。 那么为什么thi wiki link提到了对数空间{\ displaystyle O(\ log n)} O(\ log n)

以下是供参考的计划

public class MajorityElement {
    /* Function to print Majority Element */
    void printMajority(int a[], int size) {
        /* Find the candidate for Majority */
        int cand = findCandidate(a, size);

        /* Print the candidate if it is Majority */
        if (isMajority(a, size, cand))
            System.out.println(" " + cand + " ");
        else
            System.out.println("No Majority Element");
    }

    /* Function to find the candidate for Majority */
    int findCandidate(int a[], int size) {
        int maj_index = 0, count = 1;
        int i;
        for (i = 1; i < size; i++) {
            if (a[maj_index] == a[i])
                count++;
            else
                count--;
            if (count == 0) {
                maj_index = i;
                count = 1;
            }
        }
        return a[maj_index];
    }

    /*
     * Function to check if the candidate occurs more than n/2 times
     */
    boolean isMajority(int a[], int size, int cand) {
        int i, count = 0;
        for (i = 0; i < size; i++) {
            if (a[i] == cand)
                count++;
        }
        if (count > size / 2)
            return true;
        else
            return false;
    }

2 个答案:

答案 0 :(得分:1)

这是因为变量count需要O(log(n))位来存储候选者的出现次数。当然,在您的日常测试中,您不太可能尝试使用超过2 ^ 32(或类似的)单元格的数组。

答案 1 :(得分:1)

这就是为什么不能总是依赖维基百科,至少在没有读者的批评性思维的情况下。 (这不应被视为不使用维基百科的理由;这是一个非常宝贵的资源,这得益于庞大而忠诚的志愿者贡献者团队。)

有两种常用的模型用于衡量空间和时间复杂度:统一成本模型和对数成本模型。统一成本模型假设单个值的存储成本为Θ(1)(无论该值的大小如何),并且单个简单算术计算的时间复杂度也为Θ(1)。如果值非常大,则这些简化不正确,因此可能需要使用对数模型。在对数模型中,我们不是通过值的计数来测量问题的大小,而是通过值的位的总大小来测量。 (A different Wikipedia article提供了对这些模型的讨论。另见参考文献。)

这对简单算术影响不大。添加两个N位数的成本为Θ(N),并且添加总大小为N位的数字向量的成本为Θ(N),就像它将是Θ(1)一样简化假设,问题的大小是以值来衡量的,而添加两个值的成本是Θ(log N)。但是如果涉及乘法和除法,复杂度计算变得更加复杂,除非数字真的非常大,否则实际上不值得走这条路,例如,各种加密算法包括对其值的操作大小是几千位。

虽然有些算法涉及足够大的数字算法,需要考虑进行精确分析,但实际上没有实际的算法涉及到如此多的输入,即值的地址大小(在random access machine)需要加以考虑。在整个宇宙中没有2个 256 亚原子粒子,因此假设有限位宽度寄存器足以用于任何寻址目的是完全合理的,其中包括计算参与对象的数量。

因此,将一个需要将输入计数维持为O(log N)(或performSegueWithIdentifier("showIngredientInRecipe", sender: self))的算法进行分类只是因为计数器在某个替代Universe中可能具有任意数量的位,最多只需要迂腐,(在我看来)对理解给定算法的复杂性没有任何帮助。

尽管如此,学生们对维基百科的贡献与任何人一样多;事实上,维基百科文化邀请迂腐的理论可能是理论上的。这仍然需要与维基百科坚持认为作者不包括“原始研究”相平衡,其中包括(再次,在我看来)以与通常公布的结果相矛盾的方式重新解释算法的存储复杂性。 (这可能解释了维基百科文章中的“需要引用”标记。)