这是我在Python中进行存储桶排序的代码。
from random import randrange
def insertion_sort(aList):
for i in range(1, len(aList)):
for j in range(i, 0, -1):
if aList[j] < aList[j-1]:
aList[j], aList[j-1] = aList[j-1], aList[j]
return aList
def bucket_sort(aList):
buckets = [[]] * len(aList)
for index, value in enumerate(aList):
buckets_index = value * len(aList) // (max(aList) + 1)
buckets[buckets_index].append(value)
answer = []
for bucket in buckets:
answer.extend(insertion_sort(bucket))
# answer += insertion_sort(bucket)
print(buckets[0])
print("\n")
# return answer
aList = [randrange(10) for _ in range(100)]
print(aList)
print("\n")
answer = bucket_sort(aList)
#print(answer)
发生了什么事?当我运行代码时,我总是发现存储桶中的第一个列表已经排序,而存储桶中的其他列表都是它的副本。 我是否需要为每个列表插入排序? 我将使用&#34;答案&#34;变量为?!
我主要依赖this visualization。
答案 0 :(得分:3)
我立即注意到的一件事是你将变量桶初始化为buckets = [[]] * len(aList)
。这将列出空列表的相同副本。因此,此列表的任何修改都会复制到buckets
的每个元素中。将此行更改为:
buckets = [[] for _ in xrange(len(aList))]
要检查列表中的列表是否是单独的对象,您可以检查其ID:
print [id(x) for x in buckets]
这应该打印一个唯一数字列表。
答案 1 :(得分:1)
我认为这种排序会更有效,而且更加pythonesque。
def bucket(k):
unique = list(set(k))
values = [k.count(uni) for uni in unique]
result = ([unique[uni] for i in range(values[uni])] for uni in range(len(unique)))
result = sum(result, [])
return result