我一直在做我的作业,比较一堆排序算法,我遇到了一个奇怪的现象。事情已经如预期的那样:insertionsort赢得了像20个整数的表格,否则快速超越了heapsort和mergesort。最多可达500,000个表格(存储在内存中)。对于5,000,000英镑(仍然存储在内存中),快速排序突然变得更糟,然后是heapsort和mergesort。数字总是随机均匀分布,关闭Windows虚拟内存。任何人都知道可能是什么原因?
void quicksortit(T *tab,int s) {
if (s==0 || s==1) return;
T tmp;
if (s==2) {
if (tab[0]>tab[1]) {
tmp=tab[0];
tab[0]=tab[1];
tab[1]=tmp;
}
return;
}
T pivot=tab[s-1];
T *f1,*f2;
f1=f2=tab;
for(int i=0;i<s;i++)
if (*f2>pivot)
f2++;
else {
tmp=*f1;
*f1=*f2;
*f2=tmp;
f1++; f2++;
}
quicksortit(tab,(f1-1)-tab);
quicksortit(f1,f2-f1);
};
答案 0 :(得分:11)
当数组中有许多重复项时,您的算法开始失败。您只注意到这个值很大,因为您一直在为算法提供具有较大跨度的随机值
(假设您使用了rand():0 - RAND_MAX),并且该问题仅出现在大阵列。
当您尝试对相同数字的数组进行排序(尝试排序100000个相同的数字,程序将崩溃)时,您将首先遍历整个数组,多余地交换元素。然后将数组拆分为两个,但是大数组只减少了1:
v
quicksortit(tab,(f1-1)-tab);
因此,您的算法变为O(n ^ 2),并且您还消耗了大量的堆栈。在这种情况下,搜索更好的支点并不会帮助您,而是选择不会出现此缺陷的quicksort()版本。
例如:
function quicksort(array)
if length(array) > 1
pivot := select middle, or a median of first, last and middle
left := first index of array
right := last index of array
while left <= right
while array[left] < pivot
left := left + 1
while array[right] > pivot
right := right - 1
if left <= right
swap array[left] with array[right]
left := left + 1
right := right - 1
quicksort(array from first index to right)
quicksort(array from left to last index)
的修改版本
答案 1 :(得分:1)
可能是您的阵列现在比L3缓存大。
Quicksort分区操作将随机元素从数组的一端移动到另一端。典型的intel L3缓存就像8MB。使用5M 4字节元素 - 您的阵列为20MB。而你正在从它的一端写到另一端。
L3中的缓存未命中转到主内存,并且 比更高级别的缓存未命中更慢
。直到现在,整个排序操作完全在CPU内部运行。