IEnumerable.Intersect与自定义比较器,不明白行为

时间:2017-01-10 14:17:25

标签: c# linq

我正在尝试为相交创建一个自定义IEqualityComparer,以便使用Regex来比较字符串,而我真的不知道它正在做什么。

这是来自LinqPad测试的代码。

比较者:

public class RegexEqualityComparer : EqualityComparer<string>
{
    public RegexEqualityComparer(string pattern, RegexOptions options = RegexOptions.None)
    {
        _re = new Regex(pattern, options);
    }

    public RegexEqualityComparer(Regex re)
    {
        _re = re;
    }

    public override bool Equals(string x, string y)
    {           
        bool res = false;

        if (Object.ReferenceEquals(x, y)) 
            res = true;
        else if (x != null && y != null)
            res = _re.IsMatch(x) && _re.IsMatch(y);

        String.Format("RES: {0}, {1} = {2}", new object[] { x, y, res }).Dump();

        return res;            
    }

    public override int GetHashCode(string obj)
    {
        return obj.GetHashCode();
    }

    // ------------------------------------------------------------------------------------------------------------------------------------------------ 
    private Regex _re;
}

跟:

RegexEqualityComparer comparer = new RegexEqualityComparer(@"^-");

new string[] { "1", "-4" }.Intersect(new string[] { "1", "-" }, comparer).Dump();

我希望这能给我{ "1", "-4" } - set1中的两个元素都出现在set2中 - 根据相等比较器;它实际给出的是:

RES: 1, 1 = True
{ "1" }

让我感到困惑的是,根据比较器中的LinqPad Dump(),即使尝试将-4与任何东西进行比较也不会感到困扰 - 唯一的转储是RES: 1, 1 = True

我确定我在这里遗漏了一些明显的东西,但根本看不到它!

1 个答案:

答案 0 :(得分:6)

public override int GetHashCode(string obj)
{
    return obj.GetHashCode();
}

如果Equals(a, b)则需要GetHashCode(a) == GetHashCode(b)。您的EqualityComparer并未对此进行处理,此错误表示Intersect()调用找不到匹配值。

与您的Equals对应的合理的实施方式是:

public override int GetHashCode(string obj)
{
  if (obj == null) return 0;
  if (_re.IsMatch(obj)) return 1;
  return obj.GetHashCode(); // catch the reference-equals part for non-matches.
}

具有相同字符的两个字符串被认为是不相等的(即它认为new string('1', 1)"1"不同)这一事实可能是故意的,也可能是一个错误。也许ReferenceEquals()应该是字符串的==