我试图使用快速排序算法对几乎排序的100,000个数字列表进行排序,但是我收到了这个错误:
Traceback (most recent call last):
File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 48, in <module>
quickSort(alist)
File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 5, in quickSort
quickSortHelper(alist,0,len(alist)-1)
File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 12, in quickSortHelper
quickSortHelper(alist,first,splitpoint-1)
File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 12, in quickSortHelper
quickSortHelper(alist,first,splitpoint-1)
.
.
(a bunch of the last line)
.
.
File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 10, in quickSortHelper
splitpoint = partition(alist,first,last)
File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 25, in partition
while leftmark <= rightmark and alist[leftmark] <= pivotvalue:
RuntimeError: maximum recursion depth exceeded in cmp
这是我的代码:
from timeit import default_timer as timer
import resource
start = timer()
def quickSort(alist):
quickSortHelper(alist,0,len(alist)-1)
def quickSortHelper(alist,first,last):
if first<last:
splitpoint = partition(alist,first,last)
quickSortHelper(alist,first,splitpoint-1)
quickSortHelper(alist,splitpoint+1,last)
def partition(alist,first,last):
pivotvalue = alist[first]
leftmark = first+1
rightmark = last
done = False
while not done:
while leftmark <= rightmark and alist[leftmark] <= pivotvalue:
leftmark = leftmark + 1
while alist[rightmark] >= pivotvalue and rightmark >= leftmark:
rightmark = rightmark -1
if rightmark < leftmark:
done = True
else:
temp = alist[leftmark]
alist[leftmark] = alist[rightmark]
alist[rightmark] = temp
temp = alist[first]
alist[first] = alist[rightmark]
alist[rightmark] = temp
return rightmark
with open('lista.txt', 'r') as f:
long_string = f.readline()
alist = long_string.split(',')
quickSort(alist)
f = open("quick.txt", "w")
print >>f,(alist)
print resource.getrusage(resource.RUSAGE_SELF).ru_maxrss / 1000
end = timer()
print(end - start)
f.close()
print 'Quick\n'
我之前尝试过对同一个列表进行排序,先将其随机洗牌,然后就可以了。
答案 0 :(得分:2)
当输入已经排序时,您选择的pivot元素(范围中最左侧)将产生“错误”分割。 分区将返回 rightmark ,而 firstmark 等于 first 的值。“
这意味着在 quickSortHelper 中, n 值列表将被拆分为一个包含零元素的列表(第一个递归调用)和一个 n列表-1 值(第二次递归调用)。如果输入已经排序,则此模式将在每个递归级别重复进行。因此,如果您的输入大小为1000,那么您将具有1000的递归深度.Python保持最大递归深度,在该深度处它将触发异常。对于大型排序列表,您将遇到此限制。
作为旁注,在这种情况下,您的运行时间最差 O(n²)。
您可以使用allow deeper recursion将Python配置为sys.setrecursionlimit
。但这是不可取的,因为这意味着你仍然使用大量的堆栈内存,并且没有摆脱排序的输入的最坏情况运行时间。
解决此问题的更好方法是随机选择您的pivot元素,在 first 和 last 之间的某处,并将该索引处的值与最左边的值交换(或最右边,但在你的实施中,它将被留下)。这样可以降低最大递归深度误差几乎为零的概率。
另请参阅Wikipedia如何引用您遇到的问题(我用粗体强调):
选择支点
在quicksort的早期版本中,通常会选择分区最左边的元素作为pivot元素。不幸的是,这会导致已经排序的数组的最坏情况行为,这是一个相当常见的用例。通过选择 的随机索引,选择分区的中间索引或(尤其是对于较长的分区)选择第一个的中位数,可以轻松解决问题 枢轴分区的中间和最后一个元素(由Sedgewick推荐)。
要实现随机选择的数据透视索引,请将这两行添加到分区函数的最顶部:
pivotmark = random.randint(first,last)
alist[first], alist[pivotmark] = alist[pivotmark], alist[first]
当然,您需要import random
。
这将解决您遇到的问题。如果您想进一步提高性能,可以查看其他几种解决方案,例如上面引用的维基百科文章中提到的解决方案,并了解它们如何对您正在处理的输入执行。
注意:另请参阅如何在一行中交换元素......