实现快速选择

时间:2014-05-30 10:27:18

标签: algorithm quickselect

我正在尝试实施quickselect算法。虽然,我已经理解了它背后的理论;我发现很难将其转换为运作良好的程序。

以下是我如何逐步实施以及我遇到问题的地方:

问题:找到A [] = {2,1,3,7,5,4,6}中的第4个最小元素

k = 4

指数:0|1|2|3|4|5|6

对应值:2|1|3|7|5|4|6

最初是l = 0r = 6

步骤1)将pivot作为最左边的元素(此问题中枢轴始终是最左侧) -

pivot_index = 0

pivot_value = 2

步骤2)应用分区算法;将枢轴放在正确的位置([<p][p][>p]) -

我们得到以下数组:1|2|3|7|5|4|6

其中,pivot_index = i-1 = 1

因此,pivot_value = 2

步骤3)pivot_indexk进行比较 -

k=3pivot_index = 1; k&GT; pivot_index

因此,我们的第k个最小数字位于数组的右侧。

右阵列= i to r,我们不再需要左侧部分(l to i-1)了。

步骤4)我们将k的值修改为k - (pivot_index) =&gt; 4-1 = 2; k = 3

以下是问题: k的值不应为2吗?因为我们在数组的左侧部分有两个值:1|2?我们应该将k计算为k - (pivot_index+1)吗?

我们假设k = 3是正确的。

第5步)&#34;新的&#34;要处理的数组:3|7|5|4|6以及相应的索引:2|3|4|5|6

现在,pivot_index = 2pivot_index = 3

步骤6)在上面的数组中应用分区算法 -

3|7|5|4|6(数组保持不变,因为数据库本身是最低值)。 i = 3

pivot_index = i-1 = 2 pivot_value = 3

步骤7)pivot_indexk

进行比较

k=3pivot_index=2

k > pivot_index

依旧......

这种做法是否正确?

这是我的代码正在运行。我使用随机数生成器来选择随机数,然后使用数组中的第一个元素交换数据透视表。

#include<stdio.h>
#include<stdlib.h>

void print_array(int arr[], int array_length){

    int i;

    for(i=0; i<array_length; ++i) {
        printf("%d ", arr[i]);
    }

}

int random_no(min, max){

    int diff = max-min;
    return (int) (((double)(diff+1)/RAND_MAX) * rand() + min);

}

void swap(int *a, int *b){

    int temp; 

    temp = *a;
    *a = *b;
    *b = temp;
}

int get_kth_small(int arr[], int k, int l, int r){

    if((r-l) >= 1){

        k = k + (l-1); 

        int pivot_index = random_no(l, r);

        int i, j;
        swap(&arr[pivot_index], &arr[l]);           //Switch the pivot with the first element in the array. Now, the pivit is in arr[l]

        i=l+1;

        for(j=l+1; j<=r; ++j){
            if(arr[j]<arr[l]){
                swap(&arr[j], &arr[i]);
                ++i;
            }
        }

        swap(&arr[l], &arr[i-1]);                   //Switch the pivot to the correct place; <p, p, >p

        printf("value of i-1: %d\n", i-1);
        printf("Value of k: %d\n", k);

        if(k == (i-1)){
            printf("Found: %d\n", arr[i]);
            return 0;
        }

        if(k>(i-1)){
            k=k-(i-1);
            get_kth_small(arr, k, i, r);
        } else {
            get_kth_small(arr, k, l, r-1);
        }

        //get_kth_small(arr, k, i, r);
        //get_kth_small(arr, k, l, i-1);

    }

}

void main(){

    srand(time(NULL));

    int arr[] = {2,1,3,7,5,4,6};
    int arr_size = sizeof(arr)/sizeof(arr[0]);
    int k = 3, l = 0;
    int r = arr_size - 1;

    //printf("Enter the value of k: ");
    //scanf("%d", &k);

    get_kth_small(arr, k, l, r);

    print_array(arr, arr_size);
    printf("\n");

}

2 个答案:

答案 0 :(得分:0)

您所描述的是实现快速选择的有效方式。有许多其他方法如何选择枢轴,其中大多数将提供更好的预期复杂性,但实质上算法是相同的。

答案 1 :(得分:0)

&#34; 第2步:将支点放在正确的位置&#34;:不要这样做。事实上,你不能把枢轴放在正确的位置,因为你不知道它是什么。分区规则是将所有元素放在小于或等于枢轴之前。把枢轴留在原处!

快速选择如下:在K元素中找到N,1)选择一个枢轴值,2)将所有元素移动到小于或等于枢轴之前,形成两个长度为NleNgt的区域,3)使用(KNle)或(K-NleNgt)递归相关区域,直到N=1

实际上,对于数据透视表可以采用任何值,即使数组中没有该值也是如此;但分区必须是NleNgt非零。