从大型xml文件获取数据而不加载到内存中。 C#

时间:2014-11-20 11:18:04

标签: c# memory-management xml-parsing

我有一个带有以下模式的xml。

<root>
 <Main1>
   .
   .
   .
 <Main1/>
 <Main2>
   <Main2ChildNode Id="1">Very Very Huge Base 64 String<Main2ChildNode>
   <Main2ChildNode Id="2">Very Very Huge Base 64 String<Main2ChildNode>
    .
    .
    .
   <Main2ChildNode Id="n">Very Very Huge Base 64 String<Main2ChildNode>
 <Main2/>
</root>

我没有将xml加载到内存中,而是尝试根据Id属性访问每个Main2ChildNode的内部文本。我需要在Main2部分收集整个数据,并以这种方式逐一处理。我正在尝试的下面的代码是逐行迭代整个xml。

是否有更好的方法来识别具有良好性能的特定Main2ChildNode内部文本。

 private String GetImageData(String Main2ChildNodeId,String XmlFilePath)
    {
         string data=null;
         using (XmlReader reader = XmlReader.Create(XmlFilePath))
         {
             reader.MoveToContent();
             while (reader.Read() && data == null)
             {
                 switch (reader.NodeType)
                 {
                     case XmlNodeType.Element:
                         if (reader.Name == "Main2ChildNode")
                         {
                             XElement el = XElement.ReadFrom(reader) as XElement;
                             if ((String)el.Attribute("Id") == Main2ChildNodeId)
                             {
                                 data= el.Value;
                             }
                         }
                         break;
                 }
             }
         }
         return data
    }

请建议更好的解决方案。

1 个答案:

答案 0 :(得分:0)

尝试使用基于事件的SAX,即在解析时触发事件,而不是一次读取整个文档。它有助于在分区中加载XML。