需要一些关于HashSet如何工作的解释

时间:2013-01-17 19:16:34

标签: c# collections

这就是我所拥有的:

class A
{
  // The uniqueness of instance must be detected by this property
  public string Key { get; set; }

  // There are other properties
}

var set = HashSet<A>()

我的一般目的是:

  • 通过set属性值提供Key集合中的实例标识

  • 使此集合尽可能快地进行包含操作

回答以下问题可能有助于我实现这一目的:

  1. 用于运行必须确定实例唯一性的ContainsAdd等方法的内容:GetHashCode()或IEquatable?最有可能的GetHashCode()作为HashSet声明为搜索速度非常快。
  2. 默认String.GetHashCode()实现不保证2个不同字符串的哈希的唯一性,那么我如何才能提供性能的唯一性?
  3. HashSet是否完全使用IEquatable?
  4. 请注意,他的集合仅在运行时创建和销毁,不会保存到数据库

1 个答案:

答案 0 :(得分:11)

集合通常使用Object.GetHashCode()Object.Equals()来获取哈希码并检查是否相等。除了最简单的对象之外,没有办法让Object.GetHashCode()返回唯一的哈希码 - 哈希码只有32位宽,每个内部状态超过32位的对象都不能映射到唯一的哈希码。因此,Object.Equals()用于在哈希码冲突的情况下检查确切的相等性。

因此,您必须使用合适的实现覆盖两个提到的方法。

public override Int32 GetHashCode()
{
    // If this.Key may be null you have to handle this case.
    return this.Key.HashCode();
}

public override Boolean Equals(Object obj)
{
    var other = obj as A;

    return (other != null) && (this.Key == other.Key);
}

或者,您可以使用HashSet<T>构造函数接受IEqualityComparer<T>并外部化这两种方法,例如,如果您无法控制要添加到集合中的类型的源代码。只需使用合适的方法创建一个实现接口的类,并将此类的实例传递给HashSet<T>构造函数。