这个桶排序实现在做什么?

时间:2016-04-18 08:23:04

标签: python algorithm sorting bucket-sort

这是我在Python中进行存储桶排序的代码。

from random import randrange


def insertion_sort(aList):
    for i in range(1, len(aList)):
        for j in range(i, 0, -1):
            if aList[j] < aList[j-1]:
                aList[j], aList[j-1] = aList[j-1], aList[j]
    return aList

def bucket_sort(aList):
    buckets =  [[]] * len(aList)
    for index, value in enumerate(aList):
        buckets_index = value * len(aList) // (max(aList) + 1)
        buckets[buckets_index].append(value)

answer = []

for bucket in buckets:
    answer.extend(insertion_sort(bucket))
    # answer += insertion_sort(bucket)

print(buckets[0])
print("\n")
# return answer


aList = [randrange(10) for _ in range(100)]
print(aList)
print("\n")
answer = bucket_sort(aList)
#print(answer)

发生了什么事?当我运行代码时,我总是发现存储桶中的第一个列表已经排序,而存储桶中的其他列表都是它的副本。 我是否需要为每个列表插入排序? 我将使用&#34;答案&#34;变量为?!

我主要依赖this visualization

2 个答案:

答案 0 :(得分:3)

我立即注意到的一件事是你将变量桶初始化为buckets = [[]] * len(aList)。这将列出空列表的相同副本。因此,此列表的任何修改都会复制到buckets的每个元素中。将此行更改为:

buckets =  [[] for _ in xrange(len(aList))]

要检查列表中的列表是否是单独的对象,您可以检查其ID:

print [id(x) for x in buckets]

这应该打印一个唯一数字列表。

答案 1 :(得分:1)

我认为这种排序会更有效,而且更加pythonesque。

def bucket(k):
    unique = list(set(k))
    values = [k.count(uni) for uni in unique]
    result = ([unique[uni] for i in range(values[uni])] for uni in range(len(unique)))
    result = sum(result, [])
    return result