我们将大型xml文件拆分为不同的文件,并在文件名末尾添加增量计数器。如果文件达到其大小,它将把数据拆分到另一个文件。 拆分作业会在文件末尾创建问题。我的意思是,有时候标签没有正确关闭。
<tupdate table="TEMP" type="update">
<columns>
<column name="B_KEY" key="true">1234</column>
<column name="DT">2017-06-05:13:39:27</column>
</columns>
</tupdate>
<tupdate table="TEMP" type="update" image="before">
<columns>
<column name="B_KEY" key="true">1234</column>
<column name="AMT">0</column>
<column name="F_KEY">4321</column>
<column name="DT -- data missed here at end of file and split starts.
我想读取所有已拆分的xml文件,并检查最后的数据是否未正确分类,然后从相应的起始标记中删除标记。
i.e. From
<tupdate table="TEMP" type="update" image="before">
<columns>
<column name="B_KEY" key="true">1234</column>
<column name="AMT">0</column>
<column name="F_KEY">3817898</column>`enter code here`
<column name="DT -- data missed here at split end.
提前致谢。