如何在C#中使用EqualityComparer返回Distinct中的特定项

时间:2015-01-05 11:18:48

标签: c# list distinct equals iequalitycomparer

我定义了一个CustomListComparer来比较List<int> AList<int> B,如果这两个列表中的Union至少等于列表,则认为它们相等。

var distinctLists = MyLists.Distinct(new CustomListComparer()).ToList();

public bool Equals(Frame other)
{
    var union = CustomList.Union(other.CustomList).ToList();
    return union.SequenceEqual(CustomList) ||
           union.SequenceEqual(other.CustomList);
}

例如,以下列表是相同的:

ListA = {1,2,3}
ListB = {1,2,3,4}

以下列表不是:

ListA = {1,5}
ListB = {1,2,3,4}

现在一切正常。但这是我的问题:哪一个列表(A或B)进入distinctLists?我有什么发言权吗?或者这一切都由编译器本身处理?

我的意思是说EqualityComparer认为两个列表相等。并将其中一个添加到distinctLists。它添加了哪一个? 我想要添加更多项目的列表。

2 个答案:

答案 0 :(得分:1)

Distinct总是添加它看到的第一个元素。所以它取决于你传入的序列的顺序。

来源非常简单,可以是found here

static IEnumerable<TSource> DistinctIterator<TSource>(IEnumerable<TSource> source, IEqualityComparer<TSource> comparer) {
    Set<TSource> set = new Set<TSource>(comparer);
    foreach (TSource element in source)
        if (set.Add(element)) yield return element;
}

如果您需要返回包含更多元素的列表,则需要自行滚动。值得注意的是Distinct是懒惰的,但你要求的实现需要急切的实现。

static class MyDistinctExtensions
{
    public static IEnumerable<T> DistinctMaxElements<T>(this IEnumerable<T> source, IEqualityComparer<T> comparer) where T : ICollection
    {
        Dictionary<T, List<T>> dictionary = new Dictionary<T, List<T>>(comparer);
        foreach (var item in source)
        {
            List<T> list;
            if (!dictionary.TryGetValue(item, out list))
            {
                list = new List<T>();
                dictionary.Add(item, list);
            }
            list.Add(item);
        }

        foreach (var list in dictionary.Values)
        {
            yield return list.Select(x => new { List = x, Count = x.Count })
                .OrderByDescending(x => x.Count)
                .First().List;
        }
    }
}

使用天真的实现更新了答案,但未经过测试。

答案 1 :(得分:1)

而不是Distinct,您可以GroupBy方法使用MaxBy ::

var distinctLists = MyLists.GroupBy(x => x, new CustomListComparer())
                           .Select(g => g.MaxBy(x => x.Count))
                           .ToList();

这将使用比较器对列表进行分组,并选择每个组中包含最多项目的列表。

MaxBy在这种情况下非常有用,您可以在MoreLINQ库中找到它。

编辑:使用纯LINQ:

var distinctLists = MyLists.GroupBy(x => x, new CustomListComparer())
                           .Select(g => g.First(x => x.Count == g.Max(l => l.Count)))
                           .ToList();