给出此(伪)marcXML。解析此类数据的最有效方法是什么?
<record>
<data tag="02">
<subfield>
Huckleberry Finn
</subfield>
</data>
</record>
<record>
<data tag="01">
<subfield>
Mitchell, Margaret
</subfield>
</data>
<data tag="02">
<subfield>
Gone with the wind
</subfield>
</data>
</record>
请注意,在第二个数据集中缺少标签=“ 02”的属性,因此该数据集没有作者。很有可能是该属性缺少了标记=“ 01”。
我尝试过的事情:
您可以遍历所有记录,获取作者,然后再次遍历标题并将两者加在一起。如果将结果放入数组中,则会出现以下问题:
authorsArray = ["Mitchell, Margaret"]
titleArray = ["Huckleberry Finn", "Gone with the wind"]
如果将两者放在一起,结果将是错误的:
result = [["Mitchell, Margaret", "Huckleberry Finn"], ["Gone with the wind"]]
此方法使用两次迭代和两个辅助数组。
任何建议将不胜感激