应用错误收集

对包含随机数的数组进行排序

时间：2018-09-23 21:38:50

标签： algorithm sorting complexity-theory notation

在此sorting animation中，我看到堆排序和合并排序最适合包含随机数的数组。但是，如果我们将这些排序算法与Radix和introsort进行比较会怎么样？

简而言之，哪种类型的排序算法最适合对由随机数组成的数组进行排序？

谢谢

2 个答案:

答案 0 :(得分：1)

对于随机数数组，对于适合缓存的较小数组，基数排序的最低有效数字优先计数变化通常最快。对于较大的阵列，先使用一个最高有效数字将阵列分成适合缓存的较小子阵列会更快。由于数据是随机的，所以基数排序的主要时间开销是随机分布的写操作，如果数组远大于缓存，则这对缓存不友好。如果原始数组和工作数组适合高速缓存，那么对于大多数系统而言，随机访问写入不会造成明显的时间损失。

对于基数排序中使用的基数也有一个选择。例如，如果使用基数256（8位“数字”），则可以将4个遍中的32位数字分类。使用基数65536（16位“数字”）通常会超过L1和/或L2缓存的大小，因此，即使只需要两次通过，它在大多数情况下也不会更快。对于64位数字，可以使用四个11位“数字”和两个10位“数字”来进行6次通过排序，而不是使用八个8位“数字”来进行8次通过排序。但是，除非数组足够大且随机数的分布足够均匀，以至于用尽了用于保存计数/索引的大部分存储空间，否则11/10位数字的变化不会更快。

链接到有关基数排序变化的先前线程：

Radix Sort Optimization