将xml拆分为文件 - 方法占用的内存更少

时间:2015-12-21 16:58:10

标签: c# xml xmlreader xelement

我需要将XML拆分成文件。 这是我的样本XML

的结构
<Data Code="L6POS1">
<Lots RowVersion="464775">
   <Lot Id="5"  Quantity="10068.0000" GUID="AA616D3D-F442-6AEE-0BAB-1D13F6961C2A" />
   <Lot Id="99"  Quantity="0.0000" GUID="24A9C957-EC98-85D5-8F96-0120F6E8A572" />
   <Lot Id="101"  Quantity="0.0000" GUID="124D17A2-1568-DB02-4327-4669FE00F741" />
   <Lot Id="103"  Quantity="0.0000" GUID="DD1730FF-27CF-1269-7AC2-3152CB6FDC46" />
   <Lot Id="105"  Quantity="0.0000" GUID="1F25378F-30D4-E4E0-9939-1E9E69C806C1" />
   <Lot Id="188"  Quantity="0.0000" GUID="2E860029-29B3-54C2-B8D1-0C6ABDA42DFF" />
   <Lot Id="189"  Quantity="0.0000" GUID="D3C58850-BC23-E8DE-A919-09CCB3F8A1D3" />
</Lots>

预期结果:FirstFile

 <Data Code="L6POS1">
 <Lots RowVersion="464775">
   <Lot Id="5"  Quantity="10068.0000" GUID="AA616D3D-F442-6AEE-0BAB-1D13F6961C2A" />
   <Lot Id="99"  Quantity="0.0000" GUID="24A9C957-EC98-85D5-8F96-0120F6E8A572" />
   <Lot Id="101"  Quantity="0.0000" GUID="124D17A2-1568-DB02-4327-4669FE00F741" />
   <Lot Id="103"  Quantity="0.0000" GUID="DD1730FF-27CF-1269-7AC2-3152CB6FDC46" />   
</Lots>
</Data>

SecondFile

<Data Code="L6POS1">
 <Lots RowVersion="464775">
   <Lot Id="105"  Quantity="0.0000" GUID="1F25378F-30D4-E4E0-9939-1E9E69C806C1" />
   <Lot Id="188"  Quantity="0.0000" GUID="2E860029-29B3-54C2-B8D1-0C6ABDA42DFF" />
   <Lot Id="189"  Quantity="0.0000" GUID="D3C58850-BC23-E8DE-A919-09CCB3F8A1D3" />
</Lots>
</Data>

实际上我正在使用:

   private IEnumerable<XElement> CreateXMLPackagesByType(string syncEntityName, XElement root)
    {
        var xmlList = new List<XElement>();
        IEnumerable<XElement> childNodes = root.Elements();

        var childsCount = childNodes.Count();

        var skip = 0;
        var take = ConfigurationService.MaxImportPackageSize;
        var rootAttributes = root.Attributes();
        XElement rootWithoutDescendants;
        while (skip < childsCount)
        {
            rootWithoutDescendants = new XElement(root.Name);
            rootWithoutDescendants.Add(rootAttributes);

            var elems = childNodes.Skip(skip).Take(take);
            skip += take;
            xmlList.Add(CreatePackage(rootWithoutDescendants, elems));
        }

        return xmlList;
    }


      private XElement CreatePackage(XElement type, IEnumerable<XElement> elems)
    {
        type.Add(elems);
        var root = new XElement("Data", type);
        root.Add(new XAttribute("Code", ConfigurationService.Code));
        return root;
    }

不幸的是,通过这种方式,在旧硬件上获得OutOfMemoryException个较大XML个文件的XElement。分割execl()是更好的方法吗?

1 个答案:

答案 0 :(得分:1)

以前建议使用SAX解析器的评论是正确的 - 这样你就可以一次一个地获得每个事件(元素等),并且之后你不必保留任何东西。

如果你完全确定你的数据与你的例子一样整齐地分成几行,那么快速而肮脏的方法就是不解析,而是一次只读一行。处理前两个,然后分解你想要的其余部分,然后处理最后两个。但是要确定(换句话说,检查)每个<Lot>元素只占用一条物理线;正如您可能已经知道的那样,他们没有理由 在XML中一直这样。