我已经从python中的heapq数据结构实现了优先级队列。现在我想从堆中删除特定元素(按值),保持堆不变量。 我知道可以通过再次删除元素和heapify()来完成,但这是O(n),并且可能非常慢,因为我有一个非常大的堆。
我正在尝试的另一件事是,如果我知道索引,我可以用最后一个元素替换它并完成_shiftup()。 但由于我不知道索引,我将不得不搜索,这也是线性时间。
我可以保持并行字典指向位置并使用它吗?如何在每次插入队列时更新这样的dict?
编辑:
实际上我需要在O(log n)时间内实现reduceKey()。如果有更好的方法直接做到这一点,那也同样好。
答案 0 :(得分:3)
您可能已经阅读过此内容,但您可以使用the heapq
docs suggest方法,即将元素标记为已删除,而不实际将其从堆中删除:
剩下的挑战围绕着寻找待定任务和 更改其优先级或完全删除它。找到一个任务 可以使用指向队列中条目的字典来完成。
删除条目或更改其优先级更加困难,因为 它会打破堆结构不变量。所以,可能的解决方案 是将现有条目标记为已删除,并添加一个新条目 修订优先顺序:
pq = [] # list of entries arranged in a heap entry_finder = {} # mapping of tasks to entries REMOVED = '<removed-task>' # placeholder for a removed task counter = itertools.count() # unique sequence count def add_task(task, priority=0): 'Add a new task or update the priority of an existing task' if task in entry_finder: remove_task(task) count = next(counter) entry = [priority, count, task] entry_finder[task] = entry heappush(pq, entry) def remove_task(task): 'Mark an existing task as REMOVED. Raise KeyError if not found.' entry = entry_finder.pop(task) entry[-1] = REMOVED def pop_task(): 'Remove and return the lowest priority task. Raise KeyError if empty.' while pq: priority, count, task = heappop(pq) if task is not REMOVED: del entry_finder[task] return task raise KeyError('pop from an empty priority queue')
这样,删除只是dict中的O(1)
查找。当被删除的项目稍后从队列中弹出时将被忽略(以O(log n)
操作的额外pop_task
为代价)。当然,缺点是,如果客户端实际上没有从队列中弹出项目,那么堆的大小将会增加,即使它根据API被“删除”了。