我有2个巨大的XML文件(每个4-5 Gb)。 XML格式如下:
<root>
<item>
<id/>
<elements/>
<elements/>
<elements/>
</item>
</root>
我需要计算是否添加或修改了更多<items>
!为此,我计划对这两个文件进行排序,然后从那里开始。为了排序,我考虑了两种方法。
将XML文件转换为其他格式并执行外部排序。
使用XSLT排序:我不确定是否可以为这么大的文件做。
我想知道这两种方法中的哪一种对于这个问题是可行的。
或者,如果有更好的方法来解决问题。
编辑:我无法将整个文件加载到磁盘上,因此使用“diff”或“bdiff”不是一种选择。