我在Python中测量Quick和Heap排序的时间,但结果之间的差异太大了。请花点时间查看我的代码:
import time
import linecache
import random
def shell_sort(some_list):
h=1
while(h<=len(some_list)):
h=3*h+1
while h>0:
for i in xrange(len(some_list)):
j = i
temp = some_list[i]
while j >= h and some_list[j-h] > temp:
some_list[j] = some_list[j - h]
j -= h
some_list[j] = temp
h = h/3 if h/9 else (0 if h==1 else 1)
some_list.reverse()
def quick_sort_r(some_list):
l = []
e = []
g = []
if len(some_list) <= 1:
return some_list
else:
pivot = some_list[0]
for x in some_list:
if x < pivot:
l.append(x)
elif x > pivot:
g.append(x)
else:
e.append(x)
l = quick_sort_r(l)
g = quick_sort_r(g)
return g + e + l
def gen(number, b=100000):
#return [random.randint(0, b) for x in xrange(number)]
some_list = []
return [some_list.append(random.randint(0, b)) for x in xrange(number)]
domain = [10000, 25000, 50000, 100000, 200000, 300000, 400000, 500000, 750000, 1000000]
for element in domain:
print 'Results for: ' + str(element) + ' elements:'
for j in range(0, 10):
temp_list = gen(element)
start = time.time()
shell_sort(temp_list)
end = time.time() - start
print end
print '*************************'
我在功能&#39; gen&#39;中使用了两种类型的代码。首先使用堆排序,第二个使用快速排序。希望有太大的区别,这是不正确的。 1000000元素的QS约为0.5秒,HS为23秒。怎么了?
先谢谢。
答案 0 :(得分:2)
这一行:
return [some_list.append(random.randint(0, b)) for x in xrange(number)]
...是一种列表理解,可生成number
some_list.append(...)
次调用的结果,所有这些调用都会返回None
:
>>> print gen(10)
[None, None, None, None, None, None, None, None, None, None]
None
比较如下:
>>> None < None
False
>>> None > None
False
所以我想你的两种都很混乱。
快速排序更快,因为有None
列表,它会成为复制列表的函数:
def quick_sort_r(some_list):
e = []
if len(some_list) <= 1:
return some_list
else:
pivot = some_list[0]
for x in some_list:
# all other comparisons are False
e.append(x)
return e
总之,请改用return [random.randint(0, b) for x in xrange(number)]
。在我的机器上,这个改变将快速排序从0.43s提高到8.9s,这可能比你期望的更多。
顺便说一句,除非你有一台快速的机器,否则Python并不能很好地同意1,000,000个数字的列表 - 我的(有点慢)计算机需要大约3秒来生成一个包含100万个数字的列表。