我正在为字符串实现CaseAccentInsensitiveEqualityComparer。我不确定如何实现GetHashCode

时间:2012-10-22 18:41:26

标签: c# .net string string-comparison

我的代码是这样的:

public class CaseAccentInsensitiveEqualityComparer : IEqualityComparer<string>
    {
        public bool Equals(string x, string y)
        {
            return string.Compare(x, y, CultureInfo.InvariantCulture, CompareOptions.IgnoreNonSpace | CompareOptions.IgnoreCase) == 0;
        }

        public int GetHashCode(string obj)
        {
             // not sure what to put here
        }
    }

我知道GetHashCode在此上下文中的作用,我缺少的是如何生成InvariantCultureIgnoreNonSpaceIgnoreCase版本的obj所以我可以返回它HashCode

我可以自己从obj删除变音符号和案例然后返回hashcode,但我想知道是否有更好的选择。

2 个答案:

答案 0 :(得分:5)

GetHashCode()内部返回0(正如@Michael Perrenoud所指出的那样),因为DictionariesHashMaps只要Equals()为两个对象返回GetHashCode()相同的价值 如果对象相等,则rule是GetHashCode()必须返回相同的值 缺点是HashSet(或Dictionary)性能降低到与使用List相同的程度。要查找项目,必须为每次比较调用Equals() 更快的方法是转换为Accent Insensitive字符串并获取其哈希码。

从此post

中移除重音(变音符号)的代码
static string RemoveDiacritics(string text)
{
    return string.Concat(
        text.Normalize(NormalizationForm.FormD)
        .Where(ch => CharUnicodeInfo.GetUnicodeCategory(ch) !=
                                        UnicodeCategory.NonSpacingMark)
    ).Normalize(NormalizationForm.FormC);
}

比较代码:

public class CaseAccentInsensitiveEqualityComparer : IEqualityComparer<string>
{
    public bool Equals(string x, string y)
    {
        return string.Compare(x, y, CultureInfo.InvariantCulture, CompareOptions.IgnoreNonSpace | CompareOptions.IgnoreCase) == 0;
    }

    public int GetHashCode(string obj)
    {
        return obj != null ? RemoveDiacritics(obj).ToUpperInvariant().GetHashCode() : 0;
    }

    private string RemoveDiacritics(string text)
    {
        return string.Concat(
            text.Normalize(NormalizationForm.FormD)
            .Where(ch => CharUnicodeInfo.GetUnicodeCategory(ch) !=
                                          UnicodeCategory.NonSpacingMark)
          ).Normalize(NormalizationForm.FormC);
    }
}

答案 1 :(得分:-1)

啊,对不起,我的方法搞砸了。在我刚刚返回对象本身的哈希码return obj.GetHashCode();之前我实现了类似的东西时,它总是会进入Equals方法。


好吧,经过多次混乱,我相信自己已经挺直了。我发现返回零,总是会强制比较器使用Equals方法。我正在寻找我实现此代码的代码来证明并将其放在这里。


这是证明它的代码。

class MyArrayComparer : EqualityComparer<object[]>
{
    public override bool Equals(object[] x, object[] y)
    {
        if (x.Length != y.Length) { return false; }
        for (int i = 0; i < x.Length; i++)
        {
            if (!x[i].Equals(y[i]))
            {
                return false;
            }
        }
        return true;
    }

    public override int GetHashCode(object[] obj)
    {
        return 0;
    }
}