LINQ分区列表包含8个成员的列表

时间:2010-09-22 20:34:55

标签: linq partitioning skip take

如何获取List(使用LINQ)并将其分解为每隔8个条目对原始列表进行分区的列表列表?

我想这样的事情会涉及Skip和/或Take,但我仍然是LINQ的新手。

编辑:使用C#/ .Net 3.5

Edit2:这个问题与其他“重复”问题的措辞不同。虽然问题是相似的,但这个问题的答案是优越的:“接受”答案都非常可靠(使用yield语句)以及Jon Skeet建议使用MoreLinq(不建议在“其他“问题。”有时重复是好的,因为他们强迫重新检查问题。

7 个答案:

答案 0 :(得分:51)

使用以下扩展方法将输入分解为子集

public static class IEnumerableExtensions
{
    public static IEnumerable<List<T>> InSetsOf<T>(this IEnumerable<T> source, int max)
    {
        List<T> toReturn = new List<T>(max);
        foreach(var item in source)
        {
                toReturn.Add(item);
                if (toReturn.Count == max)
                {
                        yield return toReturn;
                        toReturn = new List<T>(max);
                }
        }
        if (toReturn.Any())
        {
                yield return toReturn;
        }
    }
}

答案 1 :(得分:37)

我们在MoreLINQ方法中只有Batch方法:

// As IEnumerable<IEnumerable<T>>
var items = list.Batch(8);

// As IEnumerable<List<T>>
var items = list.Batch(8, seq => seq.ToList());

答案 2 :(得分:15)

你最好使用像MoreLinq这样的库,但如果你真的必须使用“普通LINQ”,你可以使用GroupBy

var sequence = new[] {1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16};

var result = sequence.Select((x, i) => new {Group = i/8, Value = x})
                     .GroupBy(item => item.Group, g => g.Value)
                     .Select(g => g.Where(x => true));

// result is: { {1,2,3,4,5,6,7,8}, {9,10,11,12,13,14,15,16} }

基本上,我们使用Select()的版本为消耗的值提供索引,我们将索引除以8以确定每个值所属的组。然后我们通过这个分组键对序列进行分组。最后一个Select只会将IGrouping<>缩减为IEnumerable<IEnumerable<T>>(由于IGroupingIEnumerable,因此并非绝对必要。)

通过在示例中分解常量8并将其替换为指定参数,可以很容易地将其转换为可重用的方法。 它不一定是最优雅的解决方案,它不再是一个懒惰的流媒体解决方案......但它确实有效。

您还可以使用迭代器块(yield return)编写自己的扩展方法,这可以提供更好的性能并使用比GroupBy更少的内存。这就是MoreLinq对IIRC的Batch()方法。

答案 3 :(得分:1)

这根本不是Linq原创设计师的想法,但请查看GroupBy的滥用行为:

public static IEnumerable<IEnumerable<T>> BatchBy<T>(this IEnumerable<T> items, int batchSize)
{
    var count = 0;
    return items.GroupBy(x => (count++ / batchSize)).ToList();
}

[TestMethod]
public void BatchBy_breaks_a_list_into_chunks()
{
    var values = new[] { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
    var batches = values.BatchBy(3);
    batches.Count().ShouldEqual(4);
    batches.First().Count().ShouldEqual(3);
    batches.Last().Count().ShouldEqual(1);
}

我认为它赢得了这个问题的“高尔夫”奖。 ToList非常重要,因为您希望在尝试对输出执行任何操作之前确保已实际执行分组。如果你删除ToList,你会得到一些奇怪的副作用。

答案 4 :(得分:0)

Take不会非常有效,因为它不会删除所记录的条目。

为什么不使用简单的循环:

public IEnumerable<IList<T>> Partition<T>(this/* <-- see extension methods*/ IEnumerable<T> src,int num)  
{  
    IEnumerator<T> enu=src.getEnumerator();  
    while(true)  
    {  
        List<T> result=new List<T>(num);  
        for(int i=0;i<num;i++)  
        {  
            if(!enu.MoveNext())  
            {  
                if(i>0)yield return result;  
                yield break;  
            }  
            result.Add(enu.Current);  
        }  
        yield return result;  
    }  
}

答案 5 :(得分:0)

from b in Enumerable.Range(0,8) select items.Where((x,i) => (i % 8) == b);

答案 6 :(得分:0)

最简单的解决方案由Mel提供:

public static IEnumerable<IEnumerable<T>> Partition<T>(this IEnumerable<T> items, 
                                                       int partitionSize)
{
    int i = 0;
    return items.GroupBy(x => i++ / partitionSize).ToArray();
}

简洁但速度较慢。上述方法将IEnumerable分成所需固定大小的块,其中块的总数不重要。要将IEnumerable拆分为N个相同大小或接近相等大小的块,您可以这样做:

public static IEnumerable<IEnumerable<T>> Split<T>(this IEnumerable<T> items, 
                                                   int numOfParts)
{
    int i = 0;
    return items.GroupBy(x => i++ % numOfParts);
}

为了加快速度,可以采用一种简单的方法:

public static IEnumerable<IEnumerable<T>> Partition<T>(this IEnumerable<T> items, 
                                                       int partitionSize)
{
    if (partitionSize <= 0)
        throw new ArgumentOutOfRangeException("partitionSize");

    int innerListCounter = 0;
    int numberOfPackets = 0;
    foreach (var item in items)
    {
        innerListCounter++;
        if (innerListCounter == partitionSize)
        {
            yield return items.Skip(numberOfPackets * partitionSize).Take(partitionSize);
            innerListCounter = 0;
            numberOfPackets++;
        }
    }

    if (innerListCounter > 0)
        yield return items.Skip(numberOfPackets * partitionSize);
}

这比现在行星上的任何东西都要快:) Split操作的等效方法here