我有两个XML文件:
第一个包含以下标记:
<book id=1>
<chpater id=1>
<sentence id = 1>
blaa blaa blaa blaa
</sentence>
<sentence id = 2>
blaa blaa blaa blaa blaa blaa blaa blaa
</sentence>
</chapter>
<chpater id=2>
<sentence id = 1>
blaa blaa blaa blaa
</sentence>
</chapter>
</book>
<book id =2>
<chapter id=1>
<sentence id=1>
blaa blaa blaa
</sentece>
</chpater>
</book>
第二个文件是章节标记的多值标记,如下所示:
<book id=1>
<chapter id=1, name= introduction, length=short>
<book id=1>
<chapter id=2, name= animals, length=long>
为每本书和该书中的章节制作了一个新标签。 如何使用多值标记替换第一个文件中的标记。 请记住,章节ID不是唯一的。但这本书是独一无二的。
答案 0 :(得分:-1)
看看lxml http://lxml.de/index.html 这是一个伟大的图书馆,具有完成此任务所需的一切。
您必须解析这两个文件,然后使用xpath在一个文件中搜索正确的内容,并将其复制到另一个文件中的右侧元素中。
我不打算为您编写整个代码,但如果您在代码中遇到特定步骤时遇到问题,我们很乐意为您提供帮助:)