在Max Heap中找到第二大元素的最快算法(有重复项)

时间:2018-12-14 23:37:01

标签: algorithm data-structures heap

如果您的最大堆包含n个整数,那么查找第二大元素的最有效方法是什么?堆可以包含重复项,因此具有n-1个最大值和1个其他值的堆将返回另一个值

例如,包含数字的堆:

4,4,4,4,4,4,4,3,4

将返回值3

有没有比O(n)运行时更快的方法?

1 个答案:

答案 0 :(得分:3)

没有比[em> O(n)更好的时间复杂度了。使用您提供的示例数据(4,4,4,4,4,4,4,3,4),堆可以例如是以下两者之一:

             4                      4
           /   \                  /   \
         4       4              4       4
        / \     / \            / \     / \
       4   4   4   4          4   4   3   4
      / \                    / \
     4   3                  4   4

... 3可以位于任何叶节点中,因为这取决于插入顺序。从根开始遍历时,无法知道3是在左边还是在右边。

如果您愿意使用略微替代的数据结构,则可以在 O(1)中完成:

在堆中存储唯一值。使用哈希图存储有关您添加的值的信息。在简单的情况下,此“信息”可以是发生计数器。因此,下一次您要在结构中插入 same 值时,您将检测到它已经在哈希图中,并且仅增加相应的出现计数器而不触摸堆。

对于上面的示例,数据结构如下:

    heap              hashmap
                    key | value (=frequency)
       4           -----+-------------------
      /              4  |  8
     3               3  |  1

如果您的数据元素是将键与一些相关数据(属性)结合在一起的复杂结构,那么您仍将只将键存储在堆中而不重复。然后,哈希图不会为每个键提供一个计数器,而是提供共享同一键的一组实际数据元素。

很明显,必须自定义插入,删除和查找等操作的实现。这是一些伪代码,假定存在两个具有相应行为的变量heaphashmap

function insert(element):
    key = element.key
    if key not in hashmap:
        hashmap.set(key, new Array)
        heap.insert(key)
    arr = hashmap.get(key) # get a reference to the array
    arr.append(element) # add element to array, affecting the hashmap-stored value

function extract(): # remove max element
    if heap.size() == 0:
        return # No more data
    key = heap.peek() # look at root value
    arr = hashmap.get(key) # get a reference to the array
    element = arr.pop() # extract from array, affecting the hashmap-stored value
    if arr.length() == 0:
        heap.extract()
        hashmap.delete(key)
    return element

function peek(): # return element with max value
    if heap.size() == 0:
        return # No more data
    key = heap.peek() # look at root value
    arr = hashmap.get(key)
    element = arr[-1] # last element in array
    return element

您可以获得的最大值小于最大值,如下所示:

key = max(heap.root.children())

...,然后根据您期望的返回值,还可以从哈希图中甚至所有它们(如果有重复项)中获取相应的数据元素。