可以在O(n logn)时间内从列表构造堆,因为将元素插入堆需要O(logn)时间并且有n个元素。
类似地,可以在O(n logn)时间内从列表构造二叉搜索树,因为将元素插入到BST中需要平均登录时间并且有n个元素。
从最小到最大遍历堆需要O(n logn)时间(因为我们必须弹出n个元素,并且每个pop需要O(logn)接收器操作)。从最小到最大遍历BST需要O(n)时间(字面上只是顺序遍历)。
因此,在我看来,构造两个结构需要相同的时间,但BST迭代的速度更快。那么,为什么我们使用" Heapsort"而不是" BSTsort"?
编辑:感谢Tobias和lrlreon的回答!总之,下面是我们使用堆而不是BST进行排序的原因。
答案 0 :(得分:3)
我可以想象您希望在搜索树上更喜欢(二进制)堆的原因有多种:
修改:二进制堆的所有操作都非常简单:
概念简单性:由于其隐式数组表示,任何知道基本索引方案的人都可以实现二进制堆( 2i + 1 , 2i + 2 是 i 的孩子,没有考虑许多困难的特殊情况 如果从理论上看二元搜索树中的这些操作 它们也很简单,但树必须明确存储,例如,使用指针,大多数操作都需要树 重新平衡以保留O(log n)高度,这需要复杂的旋转(红黑树)或分裂/合并 节点(B树)
编辑:存储:正如Irleon所指出的,要存储BST,您还需要更多存储空间,因为除了值本身之外,每个条目至少需要存储两个子指针,这可能很大存储开销,特别是对于小值类型。同时,堆不需要额外的指针。
回答关于排序的问题:BST需要O(n)时间来按顺序遍历,构造过程需要O(n log n)次操作,如前所述,这些操作要复杂得多。
同时,Heapsort实际上可以通过在O(n)时间内从输入数组构建最大堆来实现,然后重复交换最大元素以返回并缩小堆。您可以将Heapsort视为插入排序,其中包含一个有用的数据结构,可让您在O(log n)时间内找到下一个最大值。
答案 1 :(得分:1)
如果排序方法包括将元素存储在数据结构中并在以排序方式提取之后,那么,尽管两种方法(heap和bst)具有相同的渐近复杂度O(n log n),但堆倾向于要快点原因是堆始终是一个完美平衡的树,其操作始终是O(log n),以确定的方式,而不是平均。使用bst,取决于平衡的标准,无论使用哪种平衡方法,插入和删除往往比堆更多的时间。另外,堆通常用存储树的级别遍历的数组实现,而不需要存储任何类型的指针。因此,如果您知道元素的数量(通常是这种情况),则堆所需的额外存储量小于用于bst的额外存储量。
在对数组进行排序的情况下,有一个非常重要的原因,它更倾向于堆而不是bst:您可以使用相同的数组来存储堆;无需使用额外的内存。