使用Linq to XML处理父子关系的子级

时间:2011-05-25 23:18:34

标签: c# xml linq linq-to-xml

我是新尝试学习LINQ to XML并遇到“孩子们”的问题。我有一个关于文档的信息的XML文件;每个文档都有一些INDEX元素,如本摘录中所示:

<DOCUMENTCOLLECTION>
<DOCUMENT>
<FILE filename="Z:\Consulting\ConverterRun4\B0000001\Submission\D003688171.0001.tif" outputpath="Z:\Consulting\ConverterRun4\B0000001\Submission"/>
<ANNOTATION filename=""/>
<INDEX name="CAN(idmDocCustom4)" value=""/>
<INDEX name="Comment(idmComment)" value="GENERAL CORRESPONDENCE 11-6-96 TO 10-29-"/>
<INDEX name="DiagnosticID(idmDocCustom5)" value="983958-0006.MDB-2155504"/>
<INDEX name="Document Class(idmDocType)" value="Submission"/>
<INDEX name="Original File Name(idmDocOriginalFile)" value="40410.TIF"/>
<INDEX name="Title(idmName)" value="1997-12"/>
<FOLDER name="/Accreditation/NCACIHE/1997-12"/>
</DOCUMENT>
<DOCUMENT>

我只需要INDEX元素中的一些值 - 名称属性为:

的值
Comment(idmComment)
Document Class(idmDocType)
Title(idmName)

这是我到目前为止测试中的内容:

namespace ConsoleApplication1
{
class DocMetaData
{
    public string Comment { get; set; }
    public string DocClass { get; set; }
    public string Title { get; set; }
    public string Folder { get; set; }
    public string File { get; set; }
}
class Program
{
     static void Main(string[] args)
    {
        XDocument xmlDoc = XDocument.Load(@"convert.B0000001.Submission.xml");
        List<DocMetaData> docList = 
        (from d in xmlDoc.Descendants("DOCUMENT")
            select new DocMetaData
            {
                Folder = d.Element("FOLDER").Attribute("name").Value,
                File = d.Element("FILE").Attribute("filename").Value,
        // need Comment, DocClass, Title from d.Element("INDEX").Attribute("name")
            }
        ).ToList<DocMetaData>();

        foreach (var c in docList)
        {
            Console.WriteLine("File name = {0}", c.File);
            Console.WriteLine("\t" + "Folder = {0}", c.Folder);
        }
        Console.ReadLine();
    }
}

}

我认为我的DocMetaData类中不需要List<Index>。我想摆脱DOCUMENT中INDEX元素的一对多方面,并分配DocMetaData类中显示的属性。我无法理解如何处理这些孩子!

--------编辑更新---- 2011年5月27日----------------------

进行了以下更改,导致编译错误;我已经研究过这个错误并尝试重新使用指令,但到目前为止还无法解决这个问题:

using System;
using System.Collections.Generic;
using System.Text;
using System.Xml.Linq;
using System.Xml.XPath;
using System.Linq;
namespace ConsoleApplication1
{
class DocMetaData
{
    public string Comment { get; set; }
    public string DocClass { get; set; }
    public string Title { get; set; }
    public string Folder { get; set; }
    public string File { get; set; }
}
class Program
{
static void Main(string[] args)
    {
        XDocument xmlDoc = XDocument.Load(@"convert.B0000001.Submission.xml");
        List<DocMetaData> docList = 
            (from d in xmlDoc.Descendants("DOCUMENT")
                select new DocMetaData
                {
                    Folder = d.Element("FOLDER").Attribute("name").Value,
                    File = d.Element("FILE").Attribute("filename").Value,
                    Comment = d.Element("INDEX")
                              .Where(i => i.Attribute("name") == "Comment(idmComment)")
                              .First()
                            .Attribute("value").Value
                }
            ).ToList<DocMetaData>();
        foreach (var c in docList)
        {
            Console.WriteLine("File name = {0}", c.File);
            Console.WriteLine("\t" + "Folder = {0}", c.Folder);
            Console.WriteLine("\t\t" + "Comment = {0}", c.Comment);
        }
        Console.ReadLine();
    }

这是错误(注意:我有System.Xml.Linq作为参考,也有一个using指令):

Error   1   'System.Xml.Linq.XElement' does not contain a definition for 'Where' and no   extension method 'Where' accepting a first argument of type 'System.Xml.Linq.XElement' could be found (are you missing a using directive or an assembly reference?)   C:\ProjectsVS2010\ConsoleApplication_LINQ\ConsoleApplication1\Program.cs    31  37  ConsoleApplication1

2 个答案:

答案 0 :(得分:2)

您可能想要获取INDEX元素,然后使用WhereFirst来获得所需的元素。

select new DocMetaData
{
    Folder = d.Element("FOLDER").Attribute("name").Value,
    File = d.Element("FILE").Attribute("filename").Value,
    Comment = d.Elements("INDEX")
               .Where(i => i.Attribute("name").Value == "Comment(idmComment)")
               .First()
               .Attribute("value").Value
    //similarly for other index elements
}

请注意,如果没有具有right属性的INDEX元素,则会抛出异常。如果要忽略没有相应索引的属性,我会将选择代码拉入自己的方法,使用FirstOrDefault,并在分配之前进行适当的空检查。

答案 1 :(得分:0)

秘密在于SelectMany。这是一篇博客文章,可以帮助您解决问题。

http://craigwatson1962.wordpress.com/2010/11/04/linq-to-xml-using-let-yield-return-and-selectmany/