如何找到重复至少N / 2次的数组元素?

时间:2010-09-18 04:21:06

标签: c algorithm

给定一个包含N个元素的数组。我们知道其中一个元素至少重复N / 2次。

我们对其他元素一无所知。它们可能重复或可能是唯一的。

有没有办法找出一次传递至少重复N / 2次的元素,或者可能是O(N)?

不使用额外空间。

8 个答案:

答案 0 :(得分:56)

由于其他用户已经发布了算法,我不再重复了。但是,我提供了一个简单的解释,说明它的工作原理:

考虑下图,实际上是非偏振光图:

arrows radiating from the centre

来自中心的每个箭头代表不同的候选人。想象一下箭头上的某个点代表计数器和候选人。最初计数器为零,因此它从中心开始 当找到当前候选者时,它向该箭头方向移动一步。如果找到不同的值,则计数器向中心移动一步 如果存在多数值,则超过一半的移动将朝向该箭头,因此算法将以当前候选者为多数值结束。

答案 1 :(得分:37)

st0le回答了这个问题,但这是一个5分钟的实施:

#include <stdio.h>

#define SIZE 13

int boyerMoore(int arr[]) {
    int current_candidate = arr[0], counter = 0, i;
    for (i = 0; i < SIZE; ++i) {
        if (current_candidate == arr[i]) {
            ++counter;
            printf("candidate: %i, counter: %i\n",current_candidate,counter);
        } else if (counter == 0) {
            current_candidate = arr[i];
            ++counter;
            printf("candidate: %i, counter: %i\n",current_candidate,counter);
        } else {
            --counter;
            printf("candidate: %i, counter: %i\n",current_candidate,counter);
        }
    }
    return current_candidate;
}

int main() {
    int numbers[SIZE] = {5,5,5,3,3,1,1,3,3,3,1,3,3};
    printf("majority: %i\n", boyerMoore(numbers));
    return 0;
}

这是一个有趣的解释(至少比阅读论文更有趣):http://userweb.cs.utexas.edu/~moore/best-ideas/mjrty/index.html

答案 2 :(得分:36)

The Boyer-Moore Majority Vote Algorithm

//list needs to have an element with a count of more than n/2 throughout itself for
//this algorithm to work properly at all times.

lst = [1,2,1,2,3,1,3,3,1,2,1,1,1]

currentCount = 0
currentValue = lst[0]
for val in lst:
   if val == currentValue:
      currentCount += 1
   else:
      currentCount -= 1

   if currentCount == 0:
      currentValue = val
      currentCount = 1


print(currentValue)

答案 3 :(得分:2)

此代码与我们找到元素的大部分

的方式类似
int find(int* arr, int size)
{ 
int count = 0, i, m;
  for (i = 0; i < size; i++) 
  {
    if (count == 0)
        m = arr[i];
    if (arr[i] == m) 
        count++;
    else
        count--;
   }
    return m;
}

答案 4 :(得分:0)

如果不使用额外的空间,似乎无法计算任何东西。你必须在某处存放至少一个柜台。如果你的意思是说你不能使用超过O(n)的空间那么它应该相当容易。

一种方法是从原始列表中创建仅包含唯一对象的第二个列表。然后,使用计数器创建与第二个列表长度相同的第三个列表,列表中每个项目的出现次数。

另一种方法是对列表进行排序,然后找到最大的连续部分。

答案 5 :(得分:0)

使用ffao向Davi建议的修改回复:

public class MaxRepeated {

    public static void main(final String[] args) {
        maxRepeatedElement(new int[]{1, 2, 1, 2, 3, 2, 3, 1});
        maxRepeatedElement(new int[]{1, 2, 1, 2, 3, 1, 3, 1});
        maxRepeatedElement(new int[]{1, 2, 1, 2, 4, 1, 1, 3, 1, 3, 1});
        maxRepeatedElement(new int[]{1, 2, 1, 2, 2, 1, 2, 3, 1, 2, 1, 2});
    }

    private static int maxRepeatedElement(final int[] arr) {

        int current_candidate = arr[0];
        int previous_candidate = arr[0];
        int counter = 0, i;
        for (i = 0; i < arr.length; ++i) {
            if (current_candidate == arr[i]) {
                ++counter;
            } else if (counter == 0) {
                previous_candidate = current_candidate;
                current_candidate = arr[i];
                ++counter;
            } else {
                --counter;
            }
            System.out.printf("  candidate: %d, counter: %d\n", current_candidate, counter);
        }

        if (counter == 0) {
            System.out.printf(" possible: %d or %d with net freq %d \n", current_candidate, previous_candidate, counter);
            final int f1 = frequency(arr, current_candidate);
            final int f2 = frequency(arr, previous_candidate);
            final int halfLen = arr.length / 2 + (arr.length % 2 == 0 ? 0 : 1);
            if (f1 >= halfLen || f2 >= halfLen) {
                if (f1 > f2) {
                    System.out.printf("majority: %d with freq %d \n", current_candidate, f1);
                } else {
                    System.out.printf("majority: %d with freq %d \n", previous_candidate, f2);
                }
            } else {
                System.out.printf("NO majority! \n");
            }
        } else {
            System.out.printf("majority: %d with freq %d \n", current_candidate, frequency(arr, current_candidate));
        }
        return current_candidate;
    }

    private static int frequency(final int[] arr, final int candidate) {
        int counter = 0;
        for (int c : arr) {
            counter += candidate == c ? 1 : 0;
        }
        return counter;
    }
}

答案 6 :(得分:0)

试试这个:

#include<iostream>
using namespace std;
int main()
{
    int counter=0;
    int a[]={10, 11, 5, 27, 4, 2, 7, 5, 7, 11, 9, 5, 5, 4, 10, 7, 5, 3, 7, 5};
    for(int i = 0; i < 20; i++)
    {
        if(a[i]==5)
        counter++;
    }
    cout << "it appears " << counter << " times";
}

答案 7 :(得分:-2)

Boyer-Moore多数投票算法未能在以下输入数组中找到正确的多数

int numbers [SIZE] = {1,2,3,4,1,2,3,4,1,2,3,4};

int numbers [SIZE] = {1,2,3,4,1,2,3,4,1,2,3,4,1};