第i阶统计量python的确定性快速选择(中值逼近的中位数)

时间:2017-08-21 13:50:27

标签: python algorithm error-handling quicksort implementation

dselect在O(n)时间内在给定的未排序的int(没有重复的)列表中找到第i个顺序统计量,捎带快速排序的原则。订单统计信息被定义为给定列表中排序版本中的第i个最小元素。因此,第一顺序统计量将是最小元素,而第n阶统计量将是最大元素,依此类推......

在运行时,我会在IndexError: list index out of range函数末尾的return arr[l]上获得dselect。我认为错误是由于我在l函数的列表0上的递归调用中将medians硬编码为dselect。 (第4行)

我该怎么做才能避免这个错误?我应该如何将l的值放在递归调用中?这甚至是这个错误的根源吗?如果这是一个愚蠢的问题,请随意指出,我将删除这个问题。我不得不问这个问题,因为我已经坚持了很长一段时间了。感谢。

def dselect(arr, l, r, i):
    if l < r:
        #finding pivot deterministically
        medians = createMedianList(arr, l, r)
        pivot = dselect(medians, 0, len(medians) - 1, len(medians) // 2) #line4

        pivot = partition(arr, l, r, pivot)
        if pivot + 1 == i:
            return arr[pivot]
        elif pivot + 1 > i:
            return dselect(arr, l, pivot - 1, i)
        else:
            return dselect(arr, pivot + 1, r, i)

    return arr[l]

def partition(arr, l, r, pivot):
    pivotIndex, i = arr.index(pivot), l
    arr[l], arr[pivotIndex] = arr[pivotIndex], arr[l]

    for j in range(l + 1, r + 1):
        if arr[j] < arr[l]:
            i += 1
            arr[i], arr[j] = arr[j], arr[i]
    arr[l], arr[i] = arr[i], arr[l]

    return i

def createMedianList(arr, l, r):
    medians = []
    for i in range(l, (r + 1) - 5 + 1):
        temp = sorted(arr[i:i + min(5, (r - l + 1) - i)])
        medians.append(temp[len(temp) // 2])

    return medians

if __name__ == '__main__':
    arr = [5, 2, 4, 3, 1, -1]
    #arr = list(map(int, open('select.txt').read().splitlines()))
    print(dselect(arr, 0, len(arr) - 1, int(input('Which order 
    statistic to find? '))))

1 个答案:

答案 0 :(得分:1)

问题是createMedianList有时会返回一个空列表: 如果l >= r-3最终会发生,就会发生这种情况。 我建议您向createMedianList添加一些内容,以确保它不会返回空列表。 例如:if medians==[]:medians=[arr[0]]或类似的东西(取决于你想为中位数提供什么属性)。