如何在Java中实现随机O(n)算法以查找未排序数组的中位数?

时间:2019-03-05 14:51:29

标签: java algorithm sorting median

我有这段代码用于在O(n)预期时间内(O(n ^ 2)最坏的情况)查找未排序数组的中值。我使用longs是因为我希望能够保留long值。

public class Randomized {

    long kthSmallestHelper(long arr[], long l, long r, long k) 
    { 
        if (k > 0 && k <= r - l + 1) 
        { 
            long pos = randomPartition(arr, l, r); 

            if (pos-l == k-1) 
                return arr[(int)pos]; 

            if (pos - l > k - 1) 
                return kthSmallestHelper(arr, l, pos - 1, k);

            return kthSmallestHelper(arr, pos + 1, r, k - pos + l - 1); 
        } 
          return Integer.MAX_VALUE; 
    } 

    void swap(long arr[], long i, long j) 
    { 
        long temp = arr[(int)i]; 
        arr[(int)i] = arr[(int)j]; 
        arr[(int)j] = temp; 
    } 

    long partition(long arr[], long l, long r) 
    { 
        long x = arr[(int)r], i = l; 
        for (long j = l; j <= r - 1; j++) 
        { 
            if (arr[(int)j] <= x) 
            { 
                swap(arr, i, j); 
                i++; 
            } 
        } 
        swap(arr, i, r); 
        return i; 
    } 

    long randomPartition(long arr[], long l, long r) 
    { 
        long n = r - l + 1; 
        long pivot = (long)(Math.random()) * (n - 1); 
        swap(arr, pivot + 1, r); 
        return partition(arr, l, r); 
    } 

    long kthSmallestRandom(long arr[], long k){
        return kthSmallestHelper(arr, 0, arr.length - 1, k);

    }

}

但是当我运行它

    long[] array =  {12, 3, 5, 7, 4, 19, 26}; //median is 7
    Randomized rand = new Randomized();
    System.out.println(rand.kthSmallestRandom(array, (array.length + 1)/2));

不正确(返回4)。

我的想法是使用第k个最小数字的这个版本来表示我希望第(length / 2)个最小数字,即中位数。

我的想法或实施方式有什么问题?

3 个答案:

答案 0 :(得分:1)

此行中的kthSmallestHelper函数中有一个小错误:

if (pos-l == k-1) 
    return arr[(int)pos];

返回使用错误的索引。尝试使用pos-l+1代替pos(并将其转换为int)。这将返回第k个项目,该项目刚刚被排序到数组中的正确位置。

答案 1 :(得分:0)

我不在运行它的位置,但是目前看来很多地方是错误的。

在Java中,当您将数组传递给函数时,仅传递数组的副本,因此您进行的任何交换都不会在该方法之外更改数组。看起来您的分区已关闭。而不是传递分区,您只是传递左右边界,而且看起来您的分区方法只向分区的左侧发送内容。

应该对这段代码加更多注释,以便我们可以告诉您在每个点上您想做什么。同样,由于您将事物交换为已排序的顺序,因此它看起来也将是O(nlogn),因为您无法在线性时间内进行排序。为什么不能为第k个最小的辅助函数使用k == 0?

答案 2 :(得分:0)

我不知道为什么,但是只是将所有long更改为int即可解决问题。现在可以正常工作了。