_radixSort_0 = [0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0];
/*
RADIX SORT
Use 256 bins
Use shadow array
- Get counts
- Transform counts to pointers
- Sort from LSB - MSB
*/
function radixSort(intArr) {
var cpy = new Int32Array(intArr.length);
var c4 = [].concat(_radixSort_0);
var c3 = [].concat(_radixSort_0);
var c2 = [].concat(_radixSort_0);
var c1 = [].concat(_radixSort_0);
var o4 = 0; var t4;
var o3 = 0; var t3;
var o2 = 0; var t2;
var o1 = 0; var t1;
var x;
for(x=0; x<intArr.length; x++) {
t4 = intArr[x] & 0xFF;
t3 = (intArr[x] >> 8) & 0xFF;
t2 = (intArr[x] >> 16) & 0xFF;
t1 = (intArr[x] >> 24) & 0xFF ^ 0x80;
c4[t4]++;
c3[t3]++;
c2[t2]++;
c1[t1]++;
}
for (x=0; x<256; x++) {
t4 = o4 + c4[x];
t3 = o3 + c3[x];
t2 = o2 + c2[x];
t1 = o1 + c1[x];
c4[x] = o4;
c3[x] = o3;
c2[x] = o2;
c1[x] = o1;
o4 = t4;
o3 = t3;
o2 = t2;
o1 = t1;
}
for(x=0; x<intArr.length; x++) {
t4 = intArr[x] & 0xFF;
cpy[c4[t4]] = intArr[x];
c4[t4]++;
}
for(x=0; x<intArr.length; x++) {
t3 = (cpy[x] >> 8) & 0xFF;
intArr[c3[t3]] = cpy[x];
c3[t3]++;
}
for(x=0; x<intArr.length; x++) {
t2 = (intArr[x] >> 16) & 0xFF;
cpy[c2[t2]] = intArr[x];
c2[t2]++;
}
for(x=0; x<intArr.length; x++) {
t1 = (cpy[x] >> 24) & 0xFF ^ 0x80;
intArr[c1[t1]] = cpy[x];
c1[t1]++;
}
return intArr;
}
到目前为止,最佳/唯一的主要优化是JS类型数组。 对正常基数排序的阴影数组使用类型数组已经产生了最好的结果。我还能够使用JS内置的堆栈push / pop来快速排除一些额外的快速排序。
Intel i7 870, 4GB, FireFox 8.0
2mil
radixSort(intArr): 172 ms
radixSortIP(intArr): 1738 ms
quickSortIP(arr): 661 ms
200k
radixSort(intArr): 18 ms
radixSortIP(intArr): 26 ms
quickSortIP(arr): 58 ms
看来标准的基数排序确实是这项工作流程的王者。如果有人有时间尝试循环展开或其他修改,我会很感激。
我有一个特定的用例,我希望在JavaScript中尽可能快地实现排序。客户端脚本将访问大型(50,000 - 2mil),未分类(基本上是随机的),整数(32位有符号)数组,然后需要对这些数据进行排序和显示。
我已经实现了相当快速的基数排序和快速排序jsfiddle benchmark,但对于我的上限数组长度,它们仍然相当慢。快速排序在我的上限数组大小上表现更好,而基数排序在我的下限上表现更好。
defaultSort is the built-in JavaScript array.sort with an integer compare function
Intel C2Q 9650, 4GB, FireFox 3.6
2mil
radixSortIP(intArr): 5554 ms
quickSortIP(arr): 1796 ms
200k
radixSortIP(intArr): 139 ms
quickSortIP(arr): 190 ms
defaultSort(intArr): 354 ms
Intel i7 870, 4GB, FireFox 8.0
2mil
radixSortIP(intArr): 990 ms
quickSortIP(arr): 882 ms
defaultSort(intArr): 3632 ms
200k
radixSortIP(intArr): 28 ms
quickSortIP(arr): 68 ms
defaultSort(intArr): 306 ms
答案 0 :(得分:12)
我测试了 typed arrays ,QSIP版本似乎在现代浏览器中表现不错:
2 000 000 元素
QSIP_TYPED | RDXIP_TYPED | QSIP_STD | RDXIP_STD
----------------------------------------------------------
Chrome | 300 1000 600 1300
Firefox | 550 1500 800 1600
支持(来源: http://caniuse.com/typedarrays):
IE 10+ | FF 4+ | Chrome 7+ | Safari 5.1+ | Opera 11.6+
答案 1 :(得分:2)
您是否考虑过多种算法组合来最大化缓存使用?我在基准测试中看到,当子阵列变小时,您将切换到插入排序。一个有趣的方法是转而使用heapsort。与quicksort结合使用时,它可以将最坏的情况降低到O(nlog(n))而不是O(n ^ 2)。看看Introsort。
答案 2 :(得分:1)
我摆弄你的基准并添加了我自己的排序功能。 它与radixsort执行相同,但它的想法(和实现)更简单,它就像一个radixsort,但在二进制中,所以你只有两个桶,可以就地做到这一点。 请看http://jsfiddle.net/KaRV9/7/。
我把我的代码放在“Quicksort就位”的位置(因为它与quicksort非常相似,只是以其他方式选择了pivot)。 运行它们几次,在我的Chrome 15中,它们表现得非常接近,无法区分它们。
答案 3 :(得分:1)
我不打算对你的排序算法发表评论。你比我更了解这些。
但是一个好主意是使用网络工作者。这允许您的排序在它自己的线程中在后台运行,因此不会阻止接口。无论如何,这都是好习惯。 Chrome和Firefox都支持它。 Opera有一个非线程版本。不确定IE中的支持,但很容易解决这个问题。当然,使用多个线程涉及开销。
可以轻松地将合并排序转换为多线程版本,这将为您带来一些性能提升。消息传递当然会带来时间损失,因此如果它运行得更快,它将真正取决于您的具体情况。但请记住,非阻塞性质可能会使应用程序对最终用户的运行速度更快。
答案 4 :(得分:0)
快速排序的良好实际方法是检查子阵列的大小,如果它足够短,则使用快速的低开销排序,对于较大的阵列来说太慢,例如插入排序。
伪代码的含义如下:
quicksort(array, start, end):
if ( (end-start) < THRESHOLD ) {
insertion_sort(array, start, end);
return;
}
// regular quicksort here
// ...
要确定THRESHOLD,您需要在您关注的平台上进行计时 - 在您的情况下 - 可能是不同的浏览器。测量具有不同阈值的随机数组的时间,以找到接近最佳的数组。如果发现重大差异,您还可以为不同的浏览器选择不同的阈值。
现在,如果您的输入不是随机的(这很常见),您可以看到更好的数据透视选择是否可以提高性能。一种常见的方法是median of three。