我正在使用dblp XML文件。我实际上想要解析dblp.xml文件,并希望提取有用的信息以供我在某个项目中进一步处理。而且这个XML文件非常庞大(1.1 GB),我甚至无法打开这个文件。
如果您有dblp.xml的C#解析器,请指导我,或者您可以指导我,或者我们如何解析大型xml文件。
答案 0 :(得分:8)
使用XML阅读器而不是XML dom。 XML dom将整个文件存储在内存中,这完全没用:
http://msdn.microsoft.com/en-us/library/system.xml.xmlreader.aspx
答案 1 :(得分:7)
您需要使用XmlReader
它代表一个读卡器,提供对XML
数据的快速,非缓存,仅向前访问。 不会将所有数据加载到内存中,应该与大量数据一起使用。其他内置的.NET
解决方案保留了完整生成的对象图。