Question

我试图使用快速排序算法对几乎排序的100,000个数字列表进行排序，但是我收到了这个错误：

Traceback (most recent call last):
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 48, in <module>
    quickSort(alist)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 5, in quickSort
    quickSortHelper(alist,0,len(alist)-1)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 12, in quickSortHelper
    quickSortHelper(alist,first,splitpoint-1)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 12, in quickSortHelper
    quickSortHelper(alist,first,splitpoint-1)
.
.
(a bunch of the last line)
.
.
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 10, in quickSortHelper
    splitpoint = partition(alist,first,last)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 25, in partition
    while leftmark <= rightmark and alist[leftmark] <= pivotvalue:
RuntimeError: maximum recursion depth exceeded in cmp

这是我的代码：

from timeit import default_timer as timer
import resource

start = timer()

def quickSort(alist):
   quickSortHelper(alist,0,len(alist)-1)

def quickSortHelper(alist,first,last):
   if first<last:    
       splitpoint = partition(alist,first,last)    
       quickSortHelper(alist,first,splitpoint-1)
       quickSortHelper(alist,splitpoint+1,last)


def partition(alist,first,last):
   pivotvalue = alist[first]    
   leftmark = first+1
   rightmark = last    
   done = False
   while not done:    
       while leftmark <= rightmark and alist[leftmark] <= pivotvalue:
           leftmark = leftmark + 1    
       while alist[rightmark] >= pivotvalue and rightmark >= leftmark:
           rightmark = rightmark -1    
       if rightmark < leftmark:
           done = True
       else:
           temp = alist[leftmark]
           alist[leftmark] = alist[rightmark]
           alist[rightmark] = temp    
   temp = alist[first]
   alist[first] = alist[rightmark]
   alist[rightmark] = temp   
   return rightmark

with open('lista.txt', 'r') as f:
    long_string = f.readline()
    alist = long_string.split(',')
quickSort(alist)
f = open("quick.txt", "w")
print >>f,(alist)
print resource.getrusage(resource.RUSAGE_SELF).ru_maxrss / 1000
end = timer()
print(end - start)
f.close()
print 'Quick\n'

我之前尝试过对同一个列表进行排序，先将其随机洗牌，然后就可以了。

Answer 1

当输入已经排序时，您选择的pivot元素（范围中最左侧）将产生“错误”分割。分区将返回 rightmark ，而 firstmark 等于 first 的值。“

这意味着在 quickSortHelper 中， n 值列表将被拆分为一个包含零元素的列表（第一个递归调用）和一个 n列表-1 值（第二次递归调用）。如果输入已经排序，则此模式将在每个递归级别重复进行。因此，如果您的输入大小为1000，那么您将具有1000的递归深度.Python保持最大递归深度，在该深度处它将触发异常。对于大型排序列表，您将遇到此限制。

作为旁注，在这种情况下，您的运行时间最差 O（n²）。

如何解决这个问题？

您可以使用allow deeper recursion将Python配置为sys.setrecursionlimit。但这是不可取的，因为这意味着你仍然使用大量的堆栈内存，并且没有摆脱排序的输入的最坏情况运行时间。

解决此问题的更好方法是随机选择您的pivot元素，在 first 和 last 之间的某处，并将该索引处的值与最左边的值交换（或最右边，但在你的实施中，它将被留下）。这样可以降低最大递归深度误差几乎为零的概率。

另请参阅Wikipedia如何引用您遇到的问题（我用粗体强调）：

选择支点

在quicksort的早期版本中，通常会选择分区最左边的元素作为pivot元素。不幸的是，这会导致已经排序的数组的最坏情况行为，这是一个相当常见的用例。通过选择的随机索引，选择分区的中间索引或（尤其是对于较长的分区）选择第一个的中位数，可以轻松解决问题 枢轴分区的中间和最后一个元素（由Sedgewick推荐）。

要实现随机选择的数据透视索引，请将这两行添加到分区函数的最顶部：

pivotmark = random.randint(first,last) alist[first], alist[pivotmark] = alist[pivotmark], alist[first]

当然，您需要import random。

这将解决您遇到的问题。如果您想进一步提高性能，可以查看其他几种解决方案，例如上面引用的维基百科文章中提到的解决方案，并了解它们如何对您正在处理的输入执行。

注意：另请参阅如何在一行中交换元素......

使用Quicksort对列表进行排序时出错“超出最大递归深度”

1 个答案:

如何解决这个问题？