使用LINQ查找多个属性的重复项

时间:2011-04-08 14:29:49

标签: c# .net linq duplicate-removal

给定一个具有以下定义的类:

public class MyTestClass
{
    public int ValueA { get; set; }
    public int ValueB { get; set; }
}

如何在MyTestClass []数组中找到重复值?

例如,

MyTestClass[] items = new MyTestClass[3];
items[0] = new MyTestClass { ValueA = 1, ValueB = 1 };
items[1] = new MyTestClass { ValueA = 0, ValueB = 1 };
items[2] = new MyTestClass { ValueA = 1, ValueB = 1 };

包含副本,因为有两个MyTestClass对象,其中ValueA ValueB都= 1

3 个答案:

答案 0 :(得分:42)

您可以通过ValueA和ValueB对元素进行分组来找到重复项。 之后再计算它们,你会发现哪些是重复的。

这就是你如何孤立欺骗:

var duplicates = items.GroupBy(i => new {i.ValueA, i.ValueB})
  .Where(g => g.Count() > 1)
  .Select(g => g.Key);

答案 1 :(得分:4)

您可以一起使用Jon Skeet的DistinctByExcept来查找重复内容。有关DistinctBy的解释,请参阅this Response

MyTestClass[] items = new MyTestClass[3];
items[0] = new MyTestClass { ValueA = 1, ValueB = 1 };
items[1] = new MyTestClass { ValueA = 0, ValueB = 1 };
items[2] = new MyTestClass { ValueA = 1, ValueB = 1 };

MyTestClass [] distinctItems = items.DistinctBy(p => new {p.ValueA, p.ValueB}).ToArray();
MyTestClass [] duplicates = items.Except(distinctItems).ToArray();

但它只返回一个项目而不是两个重复项目。

答案 2 :(得分:1)

MyTestClass应该实现Equals方法。

public bool Equals(MyTestClass x, MyTestClass y)
{
    if (Object.ReferenceEquals(x, y)) return true;

    if (Object.ReferenceEquals(x, null) ||
        Object.ReferenceEquals(y, null))
            return false;

        return x.ValueA == y.ValueA && y.ValueB == y.ValueB;
}

这里有一个关于它的good article

之后,您可以使用“Distinct”方法获取MyTestClass的“干净”列表。