使用延迟执行和延迟加载获取Count()

时间:2011-06-28 21:05:51

标签: c# linq lazy-loading deferred-execution

我有一些使用延迟执行和延迟加载的代码:

    public static IEnumerable<XElement> GetStreamElementP(string fileId, ListProgressEventHandler progressHandler, int total)
    {
        var filePath = Utility.GetEContentFilePath(fileId);
        using (var reader = XmlReader.Create(filePath, new XmlReaderSettings { IgnoreWhitespace = true, }))
        {
            var cnt = 0;
            reader.MoveToContent();
            // Parse the file and display each of the p nodes.
            reader.Read();
            while (reader.NodeType == XmlNodeType.Element && reader.Name == "p")
            {
                cnt++;
                var returnedValue = XElement.ReadFrom(reader) as XElement;

                int rem = cnt % _streamElementCallBackSize;
                if (progressHandler != null && rem == 0)
                {
                    progressHandler(null, new ListProgressEventArgs { ItemsProcessed = cnt, TotalItemsToProcess = total, });
                }
                yield return returnedValue;
            }
            reader.Close();
        }

    }

我希望能够简单地计算元素的数量。我们当前使用的代码是:

    public static int FileElementsCount(string fileId)
    {
        var cnt = 0;
        foreach (XElement e in GetStreamElementP(fileId))
        {
            cnt++;
        }
        return cnt;
    }

我可以改进吗?

    public static int FileElementsCount(string fileId)
    {
        return GetStreamElementP(fileId).Count<XElement>();
    }

或者这会导致计数时使用更多内存吗?在某些情况下,我们正在处理非常大的文件,并尝试尽可能减少内存使用量。

我试图找到一个具体的例子来解释在每种情况下如何使用内存而没有任何成功。

提前感谢您的帮助。

2 个答案:

答案 0 :(得分:2)

这并不重要。你的方法和count方法都在内部对GetStreamElementP的结果执行直接循环(这里没有懒惰的东西)。没有缓存或任何涉及的内容。

如果你想让它更快,你要么必须找到一种智能的缓存/预先计算GetStreamElementP-结果的方法,要么在GetStreamElementP上有一个变量,它直接对文件进行更智能的计数

答案 1 :(得分:0)

在你的情况下,计算计数的两种方式都是一样的。

此函数的内存消耗应与<p>元素的大小成比例。因此,如果有很多小元素,它不应该消耗大量内存。如果你有相对较少的巨大元素,这可能会消耗相当多的内存,因为你正在创建一个XElement。如果是这种情况,可以通过不创建内存消耗来使内存消耗小得多。