Question

这是我在Python中进行存储桶排序的代码。

from random import randrange


def insertion_sort(aList):
    for i in range(1, len(aList)):
        for j in range(i, 0, -1):
            if aList[j] < aList[j-1]:
                aList[j], aList[j-1] = aList[j-1], aList[j]
    return aList

def bucket_sort(aList):
    buckets =  [[]] * len(aList)
    for index, value in enumerate(aList):
        buckets_index = value * len(aList) // (max(aList) + 1)
        buckets[buckets_index].append(value)

answer = []

for bucket in buckets:
    answer.extend(insertion_sort(bucket))
    # answer += insertion_sort(bucket)

print(buckets[0])
print("\n")
# return answer


aList = [randrange(10) for _ in range(100)]
print(aList)
print("\n")
answer = bucket_sort(aList)
#print(answer)

发生了什么事？当我运行代码时，我总是发现存储桶中的第一个列表已经排序，而存储桶中的其他列表都是它的副本。我是否需要为每个列表插入排序？我将使用＆＃34;答案＆＃34;变量为？！

我主要依赖this visualization。

Answer 1

我立即注意到的一件事是你将变量桶初始化为buckets = [[]] * len(aList)。这将列出空列表的相同副本。因此，此列表的任何修改都会复制到buckets的每个元素中。将此行更改为：

buckets =  [[] for _ in xrange(len(aList))]

要检查列表中的列表是否是单独的对象，您可以检查其ID：

print [id(x) for x in buckets]

这应该打印一个唯一数字列表。

Answer 2

我认为这种排序会更有效，而且更加pythonesque。

def bucket(k):
    unique = list(set(k))
    values = [k.count(uni) for uni in unique]
    result = ([unique[uni] for i in range(values[uni])] for uni in range(len(unique)))
    result = sum(result, [])
    return result

这个桶排序实现在做什么？

2 个答案: