改进合并排序

时间:2013-03-22 20:22:02

标签: python algorithm

我正在练习合并排序,如果我的第二个版本比第一个版本更好,我很好奇 - 它似乎是在内存需求方面,因为我从列表中弹出而不仅仅是移动索引

版本1:

def mergesort(L):
    if len(L)<=1: return L
    pivot=len(L)/2
    left=mergesort(L[:pivot])
    right=mergesort(L[pivot:])
    i=j=0
    sortedArr=[]
    while i<len(left) and j<len(right):
        if left[i]<right[j]:
            sortedArr.append(left[i])
            i+=1
        else:
            sortedArr.append(right[j])
            j+=1
    return sortedArr + left[i:] + right[j:]

第2版

def mergesort(L):
    if len(L)<=1: return L
    pivot=len(L)/2
    left=mergesort(L[:pivot])
    right=mergesort(L[pivot:])
    sortedArr=[]
    while left!=[] and right!=[]:
        if left[0]<right[0]:
            sortedArr.append(left.pop(0))
        else:
            sortedArr.append(right.pop(0))
    return sortedArr + left + right

如果不进行并行化,是否有任何方法可以进一步改进版本2,假设它优于版本1?到目前为止,我如何描述这两个版本的内存要求?

2 个答案:

答案 0 :(得分:1)

为什么不在收藏中使用deque?它会降低popleft()操作的成本吗?

答案 1 :(得分:0)

对于列表LL[:n]操作为O(n)时间,Python中为O(n)空格(它会创建一个包含n元素的新列表。)< / p>

鉴于abc列表,a + b + cO(n)时间和空格,其中nlen(a) + len(b) + len(c) (它还会创建一个包含n元素的新列表。)

因此,每次拨打mergesort()都需要T(n) = 2T(n/2) + O(n)时间和空间,即T(n) = O(n*log(n))

由于left.pop(0) O(len(left))操作,您的第二个版本的时间复杂度更低。第二个版本的内存要求与第一个版本的内存要求渐近相同。

这是具有相同结构的O(n*log(n))时间,O(n)空间解决方案(使用Python 3.3+语法):

def mergesort(L):
    return list(merge_sort_gen(L, 0, len(L)))

def merge_sort_gen(L, start, n): # O(n*log(n)) time, O(n) space
    if n == 1:  # a list of one element is always sorted
        yield L[start]
    elif n > 1: # sort halves and merge them
        half = n // 2
        yield from merge(merge_sort_gen(L, start, half),
                         merge_sort_gen(L, start + half, n - half))

merge()合并两个已排序的迭代器。您可以使用heapq.merge()或:

from functools import partial

def merge(sorted_a, sorted_b, done=object()): # O(n) time, O(1) space
    next_a, next_b = partial(next, sorted_a, done), partial(next, sorted_b, done)

    a, b = next_a(), next_b()
    while a is not done and b is not done:
        if b < a:
            yield b
            b = next_b()
        else:
            yield a
            a = next_a()

    item, rest = (a, sorted_a) if b is done else (b, sorted_b)
    yield item #XXX at least one of sorted_a or sorted_b must be non-empty
    yield from rest

你可以follow the code step by step at Python Tutor

yield from iterable生成与(但内部细节不同)相同的项目:

for item in iterable:
    yield item

请参阅The Python yield keyword explained