使用Quicksort对列表进行排序时出错“超出最大递归深度”

时间:2017-05-13 20:02:03

标签: python-2.7 sorting quicksort

我试图使用快速排序算法对几乎排序的100,000个数字列表进行排序,但是我收到了这个错误:

Traceback (most recent call last):
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 48, in <module>
    quickSort(alist)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 5, in quickSort
    quickSortHelper(alist,0,len(alist)-1)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 12, in quickSortHelper
    quickSortHelper(alist,first,splitpoint-1)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 12, in quickSortHelper
    quickSortHelper(alist,first,splitpoint-1)
.
.
(a bunch of the last line)
.
.
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 10, in quickSortHelper
    splitpoint = partition(alist,first,last)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 25, in partition
    while leftmark <= rightmark and alist[leftmark] <= pivotvalue:
RuntimeError: maximum recursion depth exceeded in cmp

这是我的代码:

from timeit import default_timer as timer
import resource

start = timer()

def quickSort(alist):
   quickSortHelper(alist,0,len(alist)-1)

def quickSortHelper(alist,first,last):
   if first<last:    
       splitpoint = partition(alist,first,last)    
       quickSortHelper(alist,first,splitpoint-1)
       quickSortHelper(alist,splitpoint+1,last)


def partition(alist,first,last):
   pivotvalue = alist[first]    
   leftmark = first+1
   rightmark = last    
   done = False
   while not done:    
       while leftmark <= rightmark and alist[leftmark] <= pivotvalue:
           leftmark = leftmark + 1    
       while alist[rightmark] >= pivotvalue and rightmark >= leftmark:
           rightmark = rightmark -1    
       if rightmark < leftmark:
           done = True
       else:
           temp = alist[leftmark]
           alist[leftmark] = alist[rightmark]
           alist[rightmark] = temp    
   temp = alist[first]
   alist[first] = alist[rightmark]
   alist[rightmark] = temp   
   return rightmark

with open('lista.txt', 'r') as f:
    long_string = f.readline()
    alist = long_string.split(',')
quickSort(alist)
f = open("quick.txt", "w")
print >>f,(alist)
print resource.getrusage(resource.RUSAGE_SELF).ru_maxrss / 1000
end = timer()
print(end - start)
f.close()
print 'Quick\n'

我之前尝试过对同一个列表进行排序,先将其随机洗牌,然后就可以了。

1 个答案:

答案 0 :(得分:2)

当输入已经排序时,您选择的pivot元素(范围中最左侧)将产生“错误”分割。 分区将返回 rightmark ,而 firstmark 等于 first 的值。“

这意味着在 quickSortHelper 中, n 值列表将被拆分为一个包含零元素的列表(第一个递归调用)和一个 n列表-1 值(第二次递归调用)。如果输入已经排序,则此模式将在每个递归级别重复进行。因此,如果您的输入大小为1000,那么您将具有1000的递归深度.Python保持最大递归深度,在该深度处它将触发异常。对于大型排序列表,您将遇到此限制。

作为旁注,在这种情况下,您的运行时间最差 O(n²)

如何解决这个问题?

您可以使用allow deeper recursion将Python配置为sys.setrecursionlimit。但这是不可取的,因为这意味着你仍然使用大量的堆栈内存,并且没有摆脱排序的输入的最坏情况运行时间。

解决此问题的更好方法是随机选择您的pivot元素,在 first last 之间的某处,并将该索引处的值与最左边的值交换(或最右边,但在你的实施中,它将被留下)。这样可以降低最大递归深度误差几乎为零的概率。

另请参阅Wikipedia如何引用您遇到的问题(我用粗体强调):

  

选择支点

     

在quicksort的早期版本中,通常会选择分区最左边的元素作为pivot元素。不幸的是,这会导致已经排序的数组的最坏情况行为,这是一个相当常见的用例。通过选择 的随机索引,选择分区的中间索引或(尤其是对于较长的分区)选择第一个的中位数,可以轻松解决问题 枢轴分区的中间和最后一个元素(由Sedgewick推荐)。

要实现随机选择的数据透视索引,请将这两行添加到分区函数的最顶部:

pivotmark = random.randint(first,last)
alist[first], alist[pivotmark] = alist[pivotmark], alist[first]

当然,您需要import random

这将解决您遇到的问题。如果您想进一步提高性能,可以查看其他几种解决方案,例如上面引用的维基百科文章中提到的解决方案,并了解它们如何对您正在处理的输入执行。

注意:另请参阅如何在一行中交换元素......