快速排序中使用的两个分区版本的差异

时间:2013-09-19 07:55:37

标签: c++ c algorithm quicksort partition

第一个是直截了当的,只是从两边走,直到找到回归。

/*C++ version, [first, last), last needs --first to fetch the last element*/
/*returns the middle of partitioning result*/
int* partition( int *first, int *last, int pivot ) {
    while (true) {
        while (*first < pivot) ++first;
        --last;//Don't edit this, it's true.
        while (pivot < *last) --last;
        if (!(first < last)) return first;
        swap(*first, *last);
        ++first;
    }
}

第二个(显示在“算法简介”中)是:

int* partition( int a[], int n, int pivot ) {
    bound = 0;
    for ( i = 1; i != n; ++i )
        if ( a[i] < pivot )
            swap( &a[i], &a[++bound]);
    swap(a, a + bound);
    return a + bound;
}

第二个的不变量是“绑定前的所有元素小于数据”。

问:两个版本的优点和缺点是什么?

我将首先给出一个,第二个需要对迭代器(指针)执行++操作,因此它可以应用于某些ForwardIterator,就像链表的迭代器一样。其他提示?

1 个答案:

答案 0 :(得分:3)

就两种算法的基本思想而言,两者都是正确的。他们将进行相同数量的比较,但第二次将比第一次进行更多的交换。

您可以通过逐步执行算法来看到这一点,因为它们使用5作为数据透视来对数组1 9 2 8 3 7 4 6 5进行分区。当第一个算法交换两个数字时,它再也不接触任何一个。第二种算法首先交换9和2,然后交换9和3,依此类推,进行多次交换,将9移动到最终位置。

还有其他差异。如果我没有犯任何错误,这就是第一个算法对数组进行分区的方式:

1 9 2 8 3 7 4 6 5
f                 l
1 9 2 8 3 7 4 6 5  # swap 9,5
  f             l
1 5 2 8 3 7 4 6 9  # swap 8,4
      f     l
1 5 2 4 3 7 8 6 9  # return f = 5
        l f

这是第二种算法对数组进行分区的方法:

1 9 2 8 3 7 4 6 5  # 1<5, swap 1,1
bi      
1 9 2 8 3 7 4 6 5  # 9>5, no swap
  bi
1 9 2 8 3 7 4 6 5  # 2<5, swap 9,2
  b i
1 2 9 8 3 7 4 6 5  # 8>5, no swap
    b i
1 2 9 8 3 7 4 6 5  # 3<5, swap 9,3
    b   i
1 2 3 8 9 7 4 6 5  # 7>5, no swap
      b   i
1 2 3 8 9 7 4 6 5  # 4<5, swap 8,4
      b     i
1 2 3 4 9 7 8 6 5  # 6>5, no swap
        b     i
1 2 3 4 9 7 8 6 5  # 5=5, exit loop, swap 9,5
        b       i
1 2 3 4 5 7 8 6 9  # return b = 4
        b       i

注意它是如何进行5次交换的,而其他算法只有2次。它还将数组中的最后一项移动到中间数组。在这种情况下,最后一个项恰好是枢轴,所以它是移动到中间的枢轴,但这不是一般情况。