解析xml的最有效方法是什么?特别是marcXML

时间:2019-05-27 20:24:45

标签: parsing xml-parsing marc

给出此(伪)marcXML。解析此类数据的最有效方法是什么?

<record>
    <data tag="02">
        <subfield>
            Huckleberry Finn
        </subfield>
    </data>
</record>


<record>
    <data tag="01">
        <subfield>
            Mitchell, Margaret
        </subfield>
    </data>
    <data tag="02">
        <subfield>
            Gone with the wind
        </subfield>
    </data>
</record>

请注意,在第二个数据集中缺少标签=“ 02”的属性,因此该数据集没有作者。很有可能是该属性缺少了标记=“ 01”。

我尝试过的事情:

您可以遍历所有记录,获取作者,然后再次遍历标题并将两者加在一起。如果将结果放入数组中,则会出现以下问题:

authorsArray = ["Mitchell, Margaret"]  
titleArray = ["Huckleberry Finn", "Gone with the wind"]

如果将两者放在一起,结果将是错误的:

result = [["Mitchell, Margaret", "Huckleberry Finn"], ["Gone with the wind"]]

此方法使用两次迭代和两个辅助数组

任何建议将不胜感激

0 个答案:

没有答案