如何从python中通过heapq实现的优先级队列中删除log(n)中的元素?

时间:2014-09-13 23:43:20

标签: python heap

我已经从python中的heapq数据结构实现了优先级队列。现在我想从堆中删除特定元素(按值),保持堆不变量。 我知道可以通过再次删除元素和heapify()来完成,但这是O(n),并且可能非常慢,因为我有一个非常大的堆。

我正在尝试的另一件事是,如果我知道索引,我可以用最后一个元素替换它并完成_shiftup()。 但由于我不知道索引,我将不得不搜索,这也是线性时间。

我可以保持并行字典指向位置并使用它吗?如何在每次插入队列时更新这样的dict?

编辑:

实际上我需要在O(log n)时间内实现reduceKey()。如果有更好的方法直接做到这一点,那也同样好。

1 个答案:

答案 0 :(得分:3)

您可能已经阅读过此内容,但您可以使用the heapq docs suggest方法,即将元素标记为已删除,而不实际将其从堆中删除:

  

剩下的挑战围绕着寻找待定任务和   更改其优先级或完全删除它。找到一个任务   可以使用指向队列中条目的字典来完成。

     

删除条目或更改其优先级更加困难,因为   它会打破堆结构不变量。所以,可能的解决方案   是将现有条目标记为已删除,并添加一个新条目   修订优先顺序:

     
pq = []                         # list of entries arranged in a heap
entry_finder = {}               # mapping of tasks to entries
REMOVED = '<removed-task>'      # placeholder for a removed task
counter = itertools.count()     # unique sequence count

def add_task(task, priority=0):
    'Add a new task or update the priority of an existing task'
    if task in entry_finder:
        remove_task(task)
    count = next(counter)
    entry = [priority, count, task]
    entry_finder[task] = entry
    heappush(pq, entry)

def remove_task(task):
    'Mark an existing task as REMOVED.  Raise KeyError if not found.'
    entry = entry_finder.pop(task)
    entry[-1] = REMOVED

def pop_task():
    'Remove and return the lowest priority task. Raise KeyError if empty.'
    while pq:
        priority, count, task = heappop(pq)
        if task is not REMOVED:
            del entry_finder[task]
            return task
    raise KeyError('pop from an empty priority queue')

这样,删除只是dict中的O(1)查找。当被删除的项目稍后从队列中弹出时将被忽略(以O(log n)操作的额外pop_task为代价)。当然,缺点是,如果客户端实际上没有从队列中弹出项目,那么堆的大小将会增加,即使它根据API被“删除”了。