如何按未知列名对数据表进行分组并计算一个字段的总和?

时间:2015-03-12 12:00:50

标签: c# linq datatable

我有一张这样的表:

 Name    Age  Gender  
 Sasha   12      W  
 Sasha   20      W  
 Sasha   21      M  
 Bob     21      M

我希望按多个字段进行分组,例如[Name][Gender],并按字段[Age]求和。这些列在编译时是未知的,因为用户可以选择它们。

所以,在这个例子中我想要这个:

 Name    Age  Gender  
 Sasha   32      W  
 Sasha   21      M  
 Bob     21      M

但LINQ无法做到这一点,因为我在编译时不知道列。

感谢您的回答!

1 个答案:

答案 0 :(得分:1)

如果要按多列分组,可以使用匿名类型。

var ageSumsPerNameAndGender = table.AsEnumerable()
    .GroupBy(row => new { Name = row.Field<string>("Name"), Gender = row.Field<string>("Gender") })
    .Select(group => new
    {
        Name = group.Key.Name,
        Gender = group.Key.Gender,
        SumOfAge = group.Sum(row => row.Field<int>("Age"))
    });

如果你想输出这个,你可以使用foreach - 循环:

Console.WriteLine("Name Age Gender");
foreach(var x in ageSumPerNamegenders)
    Console.WriteLine("{0} {1} {2}", x.Name, x.SumOfAge, x.Gender);

根据您的评论,您似乎实际上不知道列,因为用户指定了它们。然后它更加困难且容易出错。

一种方法是为多个字段提供自定义IEqualityComparer<T>。这应该有效:

public class MultiFieldComparer : IEqualityComparer<IEnumerable<object>>
{
    public bool Equals(IEnumerable<object> x, IEnumerable<object> y)
    {
        if(x == null || y == null) return false;
        return x.SequenceEqual(y);
    }

    public int GetHashCode(IEnumerable<object> objects)
    {
        if(objects == null) return 0;
        unchecked  
        {
            int hash = 17;
            foreach(object obj in objects)
                hash = hash * 23 + (obj == null ? 0 : obj.GetHashCode());
            return hash;
        }
    }
}

现在,您可以将此比较器的实例用于Enumerable.GroupBy(以及许多其他LINQ方法)。这是一个有效的例子:

List<string> columnNames = new List<string> { "Name", "Gender" };

var columnsToGroupBy = table.Columns.Cast<DataColumn>()
    .Where(c => columnNames.Contains(c.ColumnName, StringComparer.InvariantCultureIgnoreCase))
    .ToArray();
var comparer = new MultiFieldComparer();
var summed = table.AsEnumerable()
    .GroupBy(row => columnsToGroupBy.Select(c => row[c]), comparer)
    .Select(group => new
    {
        AllFields = group.Key,
        Sum = group.Sum(row => row.IsNull("Age") ? 0 : decimal.Parse(row["Age"].ToString()))
    });
foreach (var x in summed)
{
    Console.WriteLine("{0} Sum: {1}", string.Join(" ", x.AllFields), x.Sum);
}

正如您所见,我已将"Age"硬编码为sum-column。它必须是数字列,因此您必须确保这一点。您也可以让用户提供它。但同样,它必须可以解析为十进制,否则它不起作用。