应用错误收集

最快的分拣技术

时间：2012-05-15 16:07:21

标签： algorithm sorting optimization

过去几天我一直在尝试各种排序算法。从...开始 1）具有O（n ^ 2）时间复杂度排序的算法 2）O（n log n）时间复杂度到位和不合适的排序技术

我想知道是否有任何排序算法在线性时间或更短的时间内排序。我听说过基数排序，在最好的情况下接近线性时间排序，有一些空间复杂性。有人可以开导我吗？

5 个答案:

答案 0 :(得分：3)

最快的一般排序是合并排序，它可以利用map / reduce模式（快速排序不能）

但是，如果您对数据有所了解，那么在某些情况下，数据集的排序速度可能会更快。

你不能比O（n）排序更快没有意义：你必须至少处理每个元素一次

回应你提到的基数类别：

（来自维基百科）

对于具有k个或更少位数的n个键，基数排序的效率为O（k·n）。有时k被表示为常数，这将使基数排序比基于最佳比较的排序算法更好（对于足够大的n），所有排序算法都是O（n·log（n））。但是，一般来说k不能算是常数。特别是，在所有键都是不同的共同（但有时是隐式）假设下，k必须至少是log（n）的顺序，导致没有比其他种类更好的结果。

答案 1 :(得分：2)

在线性时间运行的一些排序算法是计算排序，基数排序和存储桶排序。这些算法的问题在于它们需要对输入进行假设。计算排序和基数排序假设输入由小范围内的整数组成。存储桶排序假设输入是由随机过程生成的，该过程在一个间隔内均匀分布元素。 Page3-6，概述了上述算法。

答案 2 :(得分：2)

你不能排序小于O（N），因为你必须查看所有N个元素以确定列表是否已排序 - 所以那里的O（N）就在那里。如果通过与列表中的其他元素进行比较排序，您也无法比O（NlogN）排序更快 - 但如果您对数据有所了解，则可以。例如，如果您知道您的数据是英文字符串，那么您可以在排序之前将它们放入存储桶中。例如将所有以A开头的字符串放入一个桶中，将B放入另一个桶中，依此类推。这会很快。您可能需要使每个存储桶相当大 - 可能大到足以容纳1000个字符串，因为并非所有存储桶都包含相同数量的字符串。

然后对各个桶进行排序，这将很快。

对于统一的数据分布（即从每个字母开始的400个字符串，当然你不会有），我会猜测这将是O（N）+ O（Nlog N / M），其中M桶的数量。

显然你可以在第二个字母上嵌套存储桶，但是你拥有的存储桶越多，你的空间需求就越大，因为必须动态扩展存储桶会花费你的执行时间，所以你想让它们足够大到从...开始。这意味着它们中的许多将比它们需要的大得多，因为您不了解数据分布的所有内容。

图书馆排序也值得一看。

答案 3 :(得分：0)

如果您想了解对整数值最快的排序技术，那么我建议您参考以下链接： https://github.com/fenilgmehta/Fastest-Integer-Sort

它对大数组使用基数排序和计数排序，对小数组使用合并排序和插入排序。据统计，这种排序算法比C ++ std :: sort的整数值要快得多。

对于“ int64_t array [10000000]”，它比C ++ STL std::sort快6倍。

答案 4 :(得分：-2)

（编辑我之前的不良帖子，对不起所有人）

提高排序算法性能的一种方法是并行处理：

Parallel Sort Algorithm

在这篇文章中，使用整数列表比较顺序和并行QuickSort算法的性能。双核机器的性能得到显着提升。根据这篇文章，QuickSort甚至可以在具有n个处理器的系统上以O（log n）执行：

http://en.wikipedia.org/wiki/Merge_sort#Parallel_processing

拥有众多核心可能听起来不真实，但是基础架构即服务（Amazon Cloud，Azure ......）它可以成为任务关键型实施的可用选项。