我的问题是我想从原始xmls创建xmls文件的子集,同时保持相同的结构。您可以说我想过滤一个子集。
处理Medline数据库的最佳方法是什么?最有效的方法是什么!
答案 0 :(得分:0)
这里是一个广泛的概述。
完全读取输入的xml文件。
确定要在哪个级别分割xml文件。 (例如3级)
确定感兴趣的标签。您可以预先确定标签,或向用户提供一些GUI以选择所需的标签。您还可以将输入文件拆分为多个文件,其中包含输入文件的所有标签。
创建输出文件。例如直到3级,文件都是相同的。从第4级开始,您将拥有许多不同的文件。
例如如果您有
之类的xml文件<L1> ....
<L2> ...
<L3> ....
<L4a> .... </L4a>
<L4b> .... </L4b>
<L4c> .... </L4c>
</L3>
</L2>
</L1>
您可以制作3个输出文件
<L1> ....
<L2> ...
<L3> ....
<L4a> .... </L4a>
</L3>
</L2>
</L1>
<L1> ....
<L2> ...
<L3> ....
<L4b> .... </L4b>
</L3>
</L2>
</L1>
等