有没有办法运行查询并检查聚合数据而无需再次重新运行查询?

时间:2015-09-16 22:26:00

标签: c# linq

我想在查询枚举LINQ查询的结果集之前查看查询结果计数(以及可能的其他聚合数据)。

几乎每个LINQ示例都会立即枚举foreach循环中的结果。但是我想检查计数以确定是否需要遍历每个结果。有没有办法运行查询并检查聚合数据而无需再次重新运行查询?如果我做了像

这样的事情
query.Count()
foreach(var item in query) { ... }

我想它会执行两次查询,但不需要再次重新执行...只能枚举来自Count()的已返回结果集。

在查询SQL数据库时,首先运行单独的聚合查询然后在需要时再获取行数据的另一个查询通常非常有效。但是,如果我正确理解LINQ,它将执行相同的操作 - 本地相同的循环和逻辑,无需任何特定的优化 - 无论我得到Count()还是做foreach。是否有一种有效的和/或内置的方法来保持多个操作的结果?

1 个答案:

答案 0 :(得分:6)

在.NET中,IEnumerable<T>序列是惰性的:这意味着底层逻辑只在您需要时执行。副作用是,如果您需要两次结果,则逻辑执行两次。

例如,如果序列绑定到SQL数据库的结果,如果您首先计算元素数量然后将它们全部列出,则SQL查询将执行两次。

有些LINQ方法只会转换 获取的结果,而不会实际获得结果。例如,var b = a.Where(a > 0);不会运行基础逻辑,但推迟到实际需要结果为止。

其他LINQ方法有效地强制执行逻辑。例如,Count()将强制加载所有元素以便对它们进行计数。 ToArray()ToList()也会这样做,将元素存储在内存中以供进一步使用。

您正在寻找的方法完全取决于上下文。

通常,您可能希望将序列存储在内存中 - 例如使用ToList() - 以便稍后对其执行多个操作,例如计算元素数量然后循环遍历所有元素。另一方面,有些情况下你需要别的东西:

  • 为了将所有内容加载到内存中,底层逻辑的影响可能太高,迫使您搜索更智能的解决方案。想象一下,您正在进行数据库搜索,并且您希望显示结果数(例如2 000 000)以及前20个条目。你真的需要将所有2 000 000个结果存储在内存中吗?可能不是。

    这里的解决方案是执行count SQL查询(数据库引擎将能够优化),然后是获得前20个结果的实际查询。

    类似的例子是当你获得很少的元素时,但它需要很多CPU周期来获得单个元素。有时,当您需要的是计算元素时,可以使用快捷方式来缩短复杂的工作。

  • 或者相反可能发生:基础逻辑和数据量太小而无法实际关注。想象一下,您正在处理A-Za-z范围内的角色。是否真的有必要做ToList()?是不是更容易计算,然后分别循环遍历字符?

  • 有时,它甚至无法将所有元素存储在内存中。例如,如果你有一个无限的序列(例如从一个不断写入的日志文件刷新的行)怎么办?

  

但是,如果我正确理解LINQ,它将执行相同的操作 - 本地相同的循环和逻辑,无需任何特定的优化 - 无论我得到Count()还是做foreach。

这完全取决于您使用的ORM。创建LINQ查询时,例如:

var count = this.SequenceFromDatabase
    .Where(product => product.Price > 0)
    .Count();

foreach (var product in this.SequenceFromDatabase.Take(10))
{
    ...
}

一些(如果不是大多数)ORM实际上将其转换为:

select count(1) from [Schema].[Table] where [Price] > 0

select top 10 [Name], [Price], [Availability] from [Schema].[Table]

鉴于从LINQ到SQL查询的实际转换取决于ORM和您编写的实际LINQ代码,因此必须密切关注正在执行的SQL查询。许多ORM都能够跟踪SQL查询,一些SQL引擎也允许您对查询进行概要分析。