应用错误收集

如何创建具有O（1）复杂度的集合

时间：2010-07-28 13:00:33

标签： algorithm data-structures collections hash theory

我想创建一个数据结构或集合，在添加，删除和计算no时会有O（1）的复杂性。元素。我该怎么开始？

我想到了一个解决方案：我将使用Hashtable并且对于插入的每个键/值对，我将只有一个哈希码，即：我的哈希码算法每次都会生成一个唯一的哈希值，所以存储该值的索引将是唯一的（即没有冲突）。

这会给我O（1）复杂性吗？

7 个答案:

答案 0 :(得分：3)

是的，这将有效，但正如您所提到的，您的散列函数需要100％唯一。任何重复都将导致您必须使用某种冲突解决方案。我建议使用线性链接。

编辑：Hashmap.size（）允许O（1）访问

编辑2：响应Larry造成的混乱= P

是，Hashing是O（k），其中k是键长。每个人都可以就此达成一致。但是，如果您没有完美的哈希，那么您根本无法获得O（1）时间。您的主张是您不需要唯一性来实现O（1）删除特定元素。我保证你错了。

考虑一个最糟糕的情况：每个元素哈希都是同一个东西。你最终得到一个链表，众所周知，没有O（1）删除。我希望，正如你所提到的，没有人会愚蠢地做出这样的哈希。

重点是，散列的唯一性是O（1）运行时的先决条件。

尽管如此，从技术上讲，它不是O（1）Big O效率。只有使用摊销分析才能在最坏的情况下实现恒定的时间效率。正如维基百科关于摊销分析的文章所述

基本思路是，最坏情况下的操作可以改变状态，使最坏情况不会再发生很长时间，从而“摊销”其成本。

这是指在某些负载因子下调整哈希表的大小（改变数据结构状态）的想法可以确保更小的冲突机会等。

我希望这能解决所有问题。

答案 1 :(得分：2)

添加，删除和大小（如果它是单独跟踪，使用简单的计数器）可以由链表提供。除非您需要删除特定项目。您应该更加具体地了解您的要求。

答案 2 :(得分：1)

即使你确切地知道被散列的东西的空间，做一个完全没有冲突的哈希函数也是非常棘手的，而且一般来说这是不可能的。它还很大程度上取决于您正在散列的数组的大小。也就是说，你需要确切地知道你正在做些什么才能做到这一点。

但是如果您放松一点，以便相同的哈希码不会暗示相等¹，那么您可以将现有的Java HashMap框架用于所有其他部分。您需要做的就是在您的密钥类中插入您自己的hashCode()实现，这是Java一直支持的。并确保你也正确定义了平等。那时，你已经完成了各种操作并不比O（1）贵得多，特别是如果你对容量和负载系数有一个很好的初步估计。

¹当然，平等必须意味着相等的哈希码。

答案 3 :(得分：1)

即使您的哈希码是唯一的，也不保证无碰撞收集。这是因为您的哈希映射不是无限大小。哈希码必须减少到哈希映射中的桶数，在减少之后，您仍然可以获得冲突。

e.g。假设我有三个对象A（哈希：2），B（哈希：18），C（哈希：66）所有唯一。假设您将它们放在容量为16（默认值）的HashMap中。如果它们在减少哈希码后被映射到％16的桶（实际上比这更复杂）我们现在有A（哈希：2％16 = 2），B（哈希：18％16 = 2），C（哈希：66％16 = 2）

除非你需要线程安全，否则HashMap可能比Hashtable更快。（在这种情况下，我建议你使用CopncurrentHashMap）恕我直言，Hashtable已有12年的遗产收藏，我建议你只在必要的时候使用它。

答案 4 :(得分：0)

链接列表无法提供哪些功能？

答案 5 :(得分：0)

令人惊讶的是，如果您事先知道所有要放入集合中的密钥，那么您的想法就会奏效。我们的想法是生成一个special hash function，它将每个键映射到(1, n)范围内的唯一值。然后我们的“哈希表”只是一个简单的数组（+一个整数来缓存元素的数量）

实现这一点并非无足轻重，但它也不是火箭科学。我将把它留给Steve Hanov来解释这些细节，因为他提供了比我更好的解释。

答案 6 :(得分：-3)

这很简单。只需使用哈希映射。你不需要做任何特别的事情。 Hashmap本身是O（1）用于插入，删除，计算元素数量。

即使键不是唯一的，只要Hashmap的大小自动扩展（如果集合太大（大多数实现将自动为您执行），算法仍然是O（1）。

因此，只需根据给定的文档使用哈希映射，一切都会好的。不要想任何更复杂的事情，这只会浪费时间。

使用哈希确实不可能避免冲突..如果可能的话，它基本上只是一个数组或映射到数组，而不是哈希。但是没有必要避免碰撞，它仍然是O（1）与碰撞。