我有一张这样的表:
Name Age Gender
Sasha 12 W
Sasha 20 W
Sasha 21 M
Bob 21 M
我希望按多个字段进行分组,例如[Name]
和[Gender]
,并按字段[Age]
求和。这些列在编译时是未知的,因为用户可以选择它们。
所以,在这个例子中我想要这个:
Name Age Gender
Sasha 32 W
Sasha 21 M
Bob 21 M
但LINQ无法做到这一点,因为我在编译时不知道列。
感谢您的回答!
答案 0 :(得分:1)
如果要按多列分组,可以使用匿名类型。
var ageSumsPerNameAndGender = table.AsEnumerable()
.GroupBy(row => new { Name = row.Field<string>("Name"), Gender = row.Field<string>("Gender") })
.Select(group => new
{
Name = group.Key.Name,
Gender = group.Key.Gender,
SumOfAge = group.Sum(row => row.Field<int>("Age"))
});
如果你想输出这个,你可以使用foreach
- 循环:
Console.WriteLine("Name Age Gender");
foreach(var x in ageSumPerNamegenders)
Console.WriteLine("{0} {1} {2}", x.Name, x.SumOfAge, x.Gender);
根据您的评论,您似乎实际上不知道列,因为用户指定了它们。然后它更加困难且容易出错。
一种方法是为多个字段提供自定义IEqualityComparer<T>
。这应该有效:
public class MultiFieldComparer : IEqualityComparer<IEnumerable<object>>
{
public bool Equals(IEnumerable<object> x, IEnumerable<object> y)
{
if(x == null || y == null) return false;
return x.SequenceEqual(y);
}
public int GetHashCode(IEnumerable<object> objects)
{
if(objects == null) return 0;
unchecked
{
int hash = 17;
foreach(object obj in objects)
hash = hash * 23 + (obj == null ? 0 : obj.GetHashCode());
return hash;
}
}
}
现在,您可以将此比较器的实例用于Enumerable.GroupBy
(以及许多其他LINQ方法)。这是一个有效的例子:
List<string> columnNames = new List<string> { "Name", "Gender" };
var columnsToGroupBy = table.Columns.Cast<DataColumn>()
.Where(c => columnNames.Contains(c.ColumnName, StringComparer.InvariantCultureIgnoreCase))
.ToArray();
var comparer = new MultiFieldComparer();
var summed = table.AsEnumerable()
.GroupBy(row => columnsToGroupBy.Select(c => row[c]), comparer)
.Select(group => new
{
AllFields = group.Key,
Sum = group.Sum(row => row.IsNull("Age") ? 0 : decimal.Parse(row["Age"].ToString()))
});
foreach (var x in summed)
{
Console.WriteLine("{0} Sum: {1}", string.Join(" ", x.AllFields), x.Sum);
}
正如您所见,我已将"Age"
硬编码为sum-column。它必须是数字列,因此您必须确保这一点。您也可以让用户提供它。但同样,它必须可以解析为十进制,否则它不起作用。