使用LINQ查询文本文件

时间:2009-08-17 21:03:07

标签: c# linq csv text-files

我有一个简单的文本文件,其中包含一些具有以下结构的CSV:

@Parent1_Field1, Parent1_Field2, Parent1_Field3
Child1_Field1, Child1_Field2
Child2_Field1, Child2_Field2
...etc.
@Parent2_Field1, Parent2_Field2, Parent2_Field3
Child1_Field1, Child1_Field2
Child2_Field1, Child2_Field2
...etc.

'@'表示紧邻其下方的子对象的父对象。 (这可以使用XML更好地表示,但在我的情况下,这不是一个选项。)

我的目的是使用LINQ查询此文件,而不将其整个内容加载到内存中。首先,我创建了一个实现IEnumerable的类(这里是:MyCustomReader),我在其中使用StreamReader来获取文件的每一行。

E.g。以下获取所有Parent对象(没有子对象):

from line in MyCustomReader
where line.StartsWith("@")
select Parent.Create(line)

然而,当我想创建涉及Parent和Child对象的查询时,我陷入困境。例如,获取特定父对象的所有子对象或获取特定子字段包含相同值的所有父对象。

E.g。这将获取特定Parent对象的所有子项:

public IEnumerable<Child> GetChildrenForAParent(string uniqueParentName)
{
    Parent parent = null;
    foreach (string line in MyCustomReader)
    {
        if (line.StartsWith("@"))
            parent = Parent.Create(line);
        else if (parent.UniqueName == uniqueParentName)
            yield return Child.Create(line);
    }
}

和第二个例子:

public IEnumerable<Parent> GetParentsWhereChildHasThisValue(string childFiledValue)
{
    Parent parent = null;
    foreach (string line in MyCustomReader)
    {
        if (line.StartsWith("@"))
        {
            parent = Line.Create(line);
        }
        else //child
        {
            Child child = Child.Create(line);
            if (child.FiledValue == childFiledValue)
                yield return parent;
        }
    }
}

如何使用LINQ实现这两个示例?

1 个答案:

答案 0 :(得分:5)

这不是很漂亮,但对于第一个类似下面的东西应该有效:

MyCustomReader.SkipWhile(line => line != uniqueParentName).Skip(1).
                                     TakeWhile(line => !line.StartsWith("@"));
编辑:好的,我很无聊。我认为这将为你做第二个(但显然它不是一个适合LINQ的问题):

var res = MyCustomReader.Where(parentLine => parentLine.StartsWith("@"))
         .Join(MyCustomReader.Where(childLine => !childLine.StartsWith("@")),
              parentLine => parentLine,
              childLine => MyCustomReader.Reverse<string>()
                   .SkipWhile(z => z != childLine)
                   .SkipWhile(x => !x.StartsWith("@")).First(),
              (x, y) => new { Parent = x, Child = y })
         .Where(a => a.Child == childFiledValue).Select(a => a.Parent);