Question

给出此（伪）marcXML。解析此类数据的最有效方法是什么？

<record>
    <data tag="02">
        <subfield>
            Huckleberry Finn
        </subfield>
    </data>
</record>


<record>
    <data tag="01">
        <subfield>
            Mitchell, Margaret
        </subfield>
    </data>
    <data tag="02">
        <subfield>
            Gone with the wind
        </subfield>
    </data>
</record>

请注意，在第二个数据集中缺少标签=“ 02”的属性，因此该数据集没有作者。很有可能是该属性缺少了标记=“ 01”。

我尝试过的事情：

您可以遍历所有记录，获取作者，然后再次遍历标题并将两者加在一起。如果将结果放入数组中，则会出现以下问题：

authorsArray = ["Mitchell, Margaret"]  
titleArray = ["Huckleberry Finn", "Gone with the wind"]

如果将两者放在一起，结果将是错误的：

result = [["Mitchell, Margaret", "Huckleberry Finn"], ["Gone with the wind"]]

此方法使用两次迭代和两个辅助数组。

任何建议将不胜感激

解析xml的最有效方法是什么？特别是marcXML

0 个答案: